231 Кб, 800x440
У меня курсач по программированию. Нужно сделать программу на c++, я задумался над созданием парсера какого ни будь авито на c++. Мне интересно мнение опытных кодеров, на сколько подходит язык c++ для создания парсера? Пишут ли вообще парсеры на c++ или же для этого лучше подойдёт python?
бамп
бамп
>>6328 (OP)
Заебешься, на авито уже собаку съели на защите от парсеров.
Если уж парсить, то это puppeteer
Заебешься, на авито уже собаку съели на защите от парсеров.
Если уж парсить, то это puppeteer
>>6328 (OP)
Подходит. C++ нужен там где требуется максимальная производительность. Например, если нужно быстро спарсить 10,000 файлов по одному-два мегабайта каждый. На таких задачах python/javascript просто умрут. Или если ты платишь посекундно и у тебя долгоиграющий скрипт.
Короче, если тебе не лень возиться с C++, то бери gumbo от гугла и вперёд. Для простых задач, лучше взять обычный JS/Python/Go и не мучатся.
опытный-кодер
>на сколько подходит язык c++ для создания парсера?
Подходит. C++ нужен там где требуется максимальная производительность. Например, если нужно быстро спарсить 10,000 файлов по одному-два мегабайта каждый. На таких задачах python/javascript просто умрут. Или если ты платишь посекундно и у тебя долгоиграющий скрипт.
Короче, если тебе не лень возиться с C++, то бери gumbo от гугла и вперёд. Для простых задач, лучше взять обычный JS/Python/Go и не мучатся.
опытный-кодер
>>6328 (OP)
На с++ есть все нужное что бы парсить, так что парси.
На чистом си была бы запарка с указателями и памятью.
На питон легче чем на с++ не будет.
По сути все сведется к поиску в строке и созданию вложенных списков.
На с++ есть все нужное что бы парсить, так что парси.
На чистом си была бы запарка с указателями и памятью.
На питон легче чем на с++ не будет.
По сути все сведется к поиску в строке и созданию вложенных списков.
Проблем не вижу. Ну будет чуть сложнее чем на одноглазом.
Главное заранее разобраться с защитой от парсеров. Это иногда сложная тема. Может занять больше времени чем весь остальной проект.
Главное заранее разобраться с защитой от парсеров. Это иногда сложная тема. Может занять больше времени чем весь остальной проект.
>>6328 (OP)
Парсил кучу говна на питоне своей либой еще когда реквестс не имел поддержки соксов.
Ща каждая залупа имеет хитровыебанную многоуровневую защиту от парсинга через какой-нибудь клаудфларе.
Перед тем как нырять в говно с головой попробуй скриптом подолбить на ее наличие, иначем можешь не успеть к сдаче курсача.
Парсил кучу говна на питоне своей либой еще когда реквестс не имел поддержки соксов.
Ща каждая залупа имеет хитровыебанную многоуровневую защиту от парсинга через какой-нибудь клаудфларе.
Перед тем как нырять в говно с головой попробуй скриптом подолбить на ее наличие, иначем можешь не успеть к сдаче курсача.
>>6363
А лучше сюда еще и какой-то антидетект с АПИ прикрутить и все антифрод системы сосут пожилую бибу
А лучше сюда еще и какой-то антидетект с АПИ прикрутить и все антифрод системы сосут пожилую бибу
>>7902
бамп
бамп
>>6328 (OP)
На плюсах можно все, ну или почти все, парсить тоже, но блять, просто возьми питон и не еби мозг, кода будет раз в 50 меньше, ну и вытекающие тесты, рефакторинг и т.д. проще и удобнее
На плюсах можно все, ну или почти все, парсить тоже, но блять, просто возьми питон и не еби мозг, кода будет раз в 50 меньше, ну и вытекающие тесты, рефакторинг и т.д. проще и удобнее