Список публикаций с меткой: парсинг
4.10.2010.
Опубликовал
Vlad в 01:02.
Категории: Delphi в Web.
Продолжаем использовать TRegExp – регулярные выражения в Delphi XE для собственных нужд. Краткое описание предыдущих частей:
Часть 1. В статье дается вводная часть, ставятся задачи для которых мы используем новые возможности Delphi XE, а именно – получить актуальную программу телепередач с сервиса tv.mail.ru. Так же в статье рассмотрено составление простого регулярного выражения для парсинга списка городов, для которых доступны программы ТВ.
Часть 2. В статье рассмотрена работа со списками телевизионных каналов. Разработаны методы получения и обработки данных по метровым и спутниковым каналам и их фильтрации в списке.
В этой статье мы рассмотрим работу с телевизионной программой для выбранного города и канала, то есть по сути подойдем к решению поставленной задачи. Для работы с HTTP мы используем библиотеку Synapse.
Читать далее »
3.10.2010.
Опубликовал
Vlad в 00:30.
Категории: Delphi в Web.
В первой части мы рассмотрели простой пример использование регулярных выражений в Delphi XE и научились получать список городов и их идентификаторов с tv.mail.ru. Теперь рассмотрим следующий шаг работы с сервисом – получение актуального списка каналов для заданного города (региона) и их распределение по категориям: метровые, спутниковые, региональные и т.д.
Читать далее »
2.10.2010.
Опубликовал
Vlad в 19:28.
Категории: Delphi в Web.
Не так давно я рассказывал о том, что в Delphi XE появилась новая возможность - использование Perl-подобных регулярных выражения в своих программах без использования каких-либо сторонних компонентов. Для этих целей используется новый тип данных - TRegExp из модуля RegularExpressions.pas. Рассмотрим пример работы с регулярными выражениями в Delphi XE и попробуем создать вместе небольшую программу, которая будет предоставлять нам какую-нибудь полезную информацию из Сети. Скажем, пусть наша программа будет получать программу телепередач с какого-нибудь сервиса. Почему именно программу тв, а не статистику запросов в Директ или позицию сайта в Яндексе? Дело в том, что в нашем случае, нам придётся выполнить не одну (как обычно), а сразу несколько задач: 1. Сделать запрос именно той программы, которая нам нужна, а именно - настроить город и список каналов. Для этого потребуется, как минимум, с помощью TRegExp вытащить с сервиса списки городов и каналов. 2. Сохранить настройки и перейти на страницу с программой ТВ. 3. Выбрать то время, за которое нам нужна программа (час, день, только вечером и т.д.) 4. Используя TRegExp пропарсить программу тв и показать пользователю, т.е. нам. Пока будем рассматривать все шаги работы заодно и научимся работе с TRegExp в Delphi XE и посмотрим как можно "вслепую" работать с несколькими разделами сайта. Для новичков, полагаю, пример в самый раз. Читать далее »
15.09.2010.
Опубликовал
Vlad в 23:31.
Категории: Основы Delphi.
Уже почти год назад я затрагивал тему о работе с регулярными выражениями VBScript в Delphi 2010. Сегодня наконец-то докачал iso-образ диска с RAD Studio XE, установил Delphi XE для более пристального ознакомления с новинками и обнаружил несколько новых модулей, цель которых - обеспечение работы с регулярными выражениями в Delphi. Я решил вспомнить прошлое и написать небольшую программку, демонстрирующую работы с регулярными выражениями с использованием "родных" модулей в Delphi XE.
Читать далее »
18.01.2010.
Опубликовал
Vlad в 18:00.
Категории: Delphi в Web.
Сегодня решил немного продолжить тему работы с XML-RPC в WordPress. Как это обычно со мной бывает, идея родилась в момент чтения случайного блога, вздумалось взглянуть на работу с постами в блоге и, заодно, попробовать написать что-нибудь под свои нужды.
Естественно программу я сегодня не выложу, но некоторые выкладки, листинги и идеи в посте будут присутствовать.
Вкратце работу с XML-RPC я рассматривал в посте "XML-RPC в Delphi. Первое знакомство с WordPress изнутри." Сегодня попробуем продвинуться дальше в своей работе и использовать несколько взаимосвязанных методов для получения определенной информации из блога.
Конкретизируем цель на сегодня: необходимо получить данные по постам в блоге, используя доступные методы из API WordPress. Читать далее »
25.10.2009.
Опубликовал
Vlad в 00:58.
Категории: Delphi в Web.
Собственно почему я вновь возвращаюсь к вопросу работы с Captcha? Во-первых, потому что способы защиты все время улучшаются и лишними знания по вопросам работы таких защит явно не будут. Во-вторых, используя полученные знания, можно будет немного сократить расходы трафика и нервов при работе со всякого рода файлообменниками прочими сайтами с защитой от ботов, которые пестрят уймой рекламы на каждой страницы - будем обходиться загрузкой всего одной картинки и целевой информации.

Ну, и в-третьих, в одном из постов рассматривался вопрос парсинга выдачи поисковиков. Там я никак не затрагивал вопрос "Что делать если всё-таки попал в бан при парсинге?" Ответ прост - вводим полуавтоматически предложенный поисковиком код (Captcha) и двигаемся дальше. Читать далее »
30.09.2009.
Опубликовал
Vlad в 12:05.
Категории: Delphi в Web, Компоненты Delphi.

Продолжаем рассматривать вопросы применения Delphi в Internet. И сегодня я рад представить Вам очередной компонент для Delphi 2010. На этот раз компонент предназначен для определения даты регистрации и возраста домена. Если воспользоваться всеми рассмотренными в блоге компонентами, включая этот, то уже можно писать небольшую программку по аудиту сайтов :)
В прошлой статье я рассмотрел небольшую программку, реализующую алгоритм подобный тому, который реализован в компоненте. Но, на самом деле основной целью написания программы было освоение навыков работы с RegExp в Delphi. Поэтому и над передачей данных особо не заморачивался и использовал простое сохранение данных в файл и дальнейшую обработку. Компонент работает несколько иначе. Читать далее »
29.09.2009.
Опубликовал
Vlad в 15:35.
Категории: Delphi в Web.
Сегодня наконец-то пересилил себя и решил всё-таки изучить вопросы использования регулярных выражений в Delphi.
Сколько раз не изучал литературу по использованию RegExp, составлению регулярных выражений и пр., всегда казалось, что составить регулярное выражение ужасно сложно, а разобраться в уже написанном выражении - просто нереально. А тут сел и буквально за час с небольшим более-менее разобрался м составил необходимое регулярное выражение. Дело бы не пошло, если бы не два блога, в которых я нашел всю необходимую информацию по регулярным выражениям, написанных понятным и доступным языком. Поэтому, вначале я хотел бы поделиться с Вами найденной информацией
Читать далее »
Свежие комментарии