25Oct
Собственно почему я вновь возвращаюсь к вопросу работы с Captcha? Во-первых, потому что способы защиты все время улучшаются и лишними знания по вопросам работы таких защит явно не будут. Во-вторых, используя полученные знания, можно будет немного сократить расходы трафика и нервов при работе со всякого рода файлообменниками прочими сайтами с защитой от ботов, которые пестрят уймой рекламы на каждой страницы – будем обходиться загрузкой всего одной картинки и целевой информации.

Ну, и в-третьих, в одном из постов рассматривался вопрос парсинга выдачи поисковиков. Там я никак не затрагивал вопрос “Что делать если всё-таки попал в бан при парсинге?” Ответ прост – вводим полуавтоматически предложенный поисковиком код (Captcha) и двигаемся дальше. Читать далее »
Метки: Captcha, Delphi, Get, Gif, http-протокол, idHTTP, Indy, RegExp, запрос, каптча, капча, парсинг
15Oct
Сразу скажу почему этот компонент Delphi я “окрестил” простейшим. Дело в том, что при парсинге выдачи Яндекса не используется никаких прокси в результате чего необходимо было выбирать временную паузу, чтобы не поисковик не блокировал запросы.
Естественно, что с таким компонентом Вы врядли соберете промышленный парсер, но на это расчёта и не было
Цель – показать возможность разработки подобного компонента для парсинга средствами Delphi 2010 и использовать его в личных целях, например для отслеживания подъемов/падений Вашего сайта в выдаче.
В последствии Вы можете продолжить разработку и приспособить компонент под свои нужды. Читать далее »
Метки: Delphi 2010, IStream, RegExp, statstg, urlmon, выдача, загрузка, регулярные выражения, Яндекс
30Sep

Продолжаем рассматривать вопросы применения Delphi в Internet. И сегодня я рад представить Вам очередной компонент для Delphi 2010. На этот раз компонент предназначен для определения даты регистрации и возраста домена. Если воспользоваться всеми рассмотренными в блоге компонентами, включая этот, то уже можно писать небольшую программку по аудиту сайтов
В прошлой статье я рассмотрел небольшую программку, реализующую алгоритм подобный тому, который реализован в компоненте. Но, на самом деле основной целью написания программы было освоение навыков работы с RegExp в Delphi. Поэтому и над передачей данных особо не заморачивался и использовал простое сохранение данных в файл и дальнейшую обработку. Компонент работает несколько иначе. Читать далее »
Метки: RegExp, whois, парсинг, регулярные выражения
29Sep
Сегодня наконец-то пересилил себя и решил всё-таки изучить вопросы использования регулярных выражений в Delphi.
Сколько раз не изучал литературу по использованию RegExp, составлению регулярных выражений и пр., всегда казалось, что составить регулярное выражение ужасно сложно, а разобраться в уже написанном выражении – просто нереально. А тут сел и буквально за час с небольшим более-менее разобрался м составил необходимое регулярное выражение. Дело бы не пошло, если бы не два блога, в которых я нашел всю необходимую информацию по регулярным выражениям, написанных понятным и доступным языком. Поэтому, вначале я хотел бы поделиться с Вами найденной информацией и заодно отблагодарить двух блоггеров пусть не жирной, но всё-таки ссылкой
Читать далее »
Метки: RegExp, парсинг
Свежие комментарии