Чем парсить?

Статус
В этой теме нельзя размещать новые ответы.

neoncobra

Постоялец
Регистрация
12 Мар 2009
Сообщения
56
Реакции
10
Прошу прощения за наивный вопрос:

Вот вы все тут составляете регулярные выражения, а как их использовать?
Какой программой или скриптом они используются?


Т.е. например необходимо сграбить сайт, чем его парсить?
 
Например, на PHP. Вытягиваете контент страницы, затем используюете функции для работы с регулярными выражениями, чтобы выдернуть нужную часть страницы.
 
Например, на PHP. Вытягиваете контент страницы, затем используюете функции для работы с регулярными выражениями, чтобы выдернуть нужную часть страницы.

Понятно что на PHP или Perl, но каким именно скриптом?
 
Понятно что на PHP или Perl, но каким именно скриптом?
Странно, что понятно, что на PHP, а не понятно чем :)

Вытягиваем страницу через cURL или через file_get_contents, по потребностям уже.
С помощью preg_match, preg_match_all вытягиваем нужный контент.
 
На перл оператор =~, !~ с //, m//, s//, split с разными нюансами. В одном сообщении всего не опишешь. Читай в доке или статье по языку, как в нем применять регулярки, а уже потом если что-то непонятно спрашивай на форуме.
 
> Т.е. например необходимо сграбить сайт, чем его парсить?
Вот есть у вас любимый язык Foo. В нём есть любимая библиотека Bar для работы с сетевыми ресурсами. Ещё в нём есть любимая библиотека (возможно в стандартной поставке) Gaz для работы с регекспами.

Далее пишете программу на Foo. C помощью Bar скачиваете код страницы и затем с помомощью Gaz парсите :-/
 
Практически для всех современных платформ разработки имеется поддержка работы с регулярными выражениями. Вопрос в том, с какой платформой/средой разработки вы чувствуете себя более комфортно. Выбирайте сначала платформу, а потом смотрите, как она поддерживает регулярные выражения.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху