19Oct
В прошлой статье про выдачу Яндекса я привел лишь один вариант и один пример парсинга выдачи с целью определения позиции сайта в результатах поиска Яндекс. На самом деле нет ничего сверхъестественного в написании подобных компонентов под свои нужды.

А если учесть то обстоятельство, что мы не используем для парсинга всякого рода ухищрения наподобие прокси, потоков и т.д., а лишь делаем небольшую паузу между запросами документов, то задача становится и вовсе простой. Всё, что по сути от нас требуется – определить шаблон страницы с выдачей, написать регулярку и чуть-чуть исправить первоначальный алгоритм парсинга, чем мы сегодня и займемся. Читать далее »
Метки: Bing, Google, Mail, Rambler, Yahoo, Апорт, парсинг выдачи, регулярные выражения, Яндекс
15Oct
Сразу скажу почему этот компонент Delphi я “окрестил” простейшим. Дело в том, что при парсинге выдачи Яндекса не используется никаких прокси в результате чего необходимо было выбирать временную паузу, чтобы не поисковик не блокировал запросы.
Естественно, что с таким компонентом Вы врядли соберете промышленный парсер, но на это расчёта и не было
Цель – показать возможность разработки подобного компонента для парсинга средствами Delphi 2010 и использовать его в личных целях, например для отслеживания подъемов/падений Вашего сайта в выдаче.
В последствии Вы можете продолжить разработку и приспособить компонент под свои нужды. Читать далее »
Метки: Delphi 2010, IStream, RegExp, statstg, urlmon, выдача, загрузка, регулярные выражения, Яндекс
30Sep

Продолжаем рассматривать вопросы применения Delphi в Internet. И сегодня я рад представить Вам очередной компонент для Delphi 2010. На этот раз компонент предназначен для определения даты регистрации и возраста домена. Если воспользоваться всеми рассмотренными в блоге компонентами, включая этот, то уже можно писать небольшую программку по аудиту сайтов
В прошлой статье я рассмотрел небольшую программку, реализующую алгоритм подобный тому, который реализован в компоненте. Но, на самом деле основной целью написания программы было освоение навыков работы с RegExp в Delphi. Поэтому и над передачей данных особо не заморачивался и использовал простое сохранение данных в файл и дальнейшую обработку. Компонент работает несколько иначе. Читать далее »
Метки: RegExp, whois, парсинг, регулярные выражения
Свежие комментарии