Парсер текста с сайта.

Тема в разделе "Мелочи", создана пользователем nemeve, 27 фев 2008.

  1. coguar

    coguar Постоялец

    Регистр.:
    4 авг 2007
    Сообщения:
    61
    Симпатии:
    11
    это RSS парсер.
     
  2. bork75

    bork75 The Team

    Регистр.:
    21 июн 2008
    Сообщения:
    1.450
    Симпатии:
    717
    Пока лучше Content Downloader ничего не видел, за последний месяц функционал расширился многократно.

    Перейти по ссылке
     
    Maza и opa100pe нравится это.
  3. kraman

    kraman Постоялец

    Регистр.:
    8 июн 2006
    Сообщения:
    129
    Симпатии:
    26
    По поводу Content Downloader - игруша для сеошников, но не маркетологов. Прога предназначена только для сбора контента, но никак не профессиональных базы данных.

    Предлагаю скинуться на Перейти по ссылке


    Данный скрипт документируется обучающим курсом (видеоинструкцией по эксплуатации, без которой тяжело будет самому разобраться).

    Краткое ревью:
    - сбор всех страниц в одну;
    - сбор разбросанных на страницах таблиц в одну;
    - сбор конкретной повторяющейся ячейки в одну;
    - сбор извлечение изображений из табличек или повторяющихся страничек в директорию;
    - извлечение указанных однородных объектов в ячейки;

    Более того:
    - экранирование области поиска между тегами(например: <b></b>, <tr><td> < a href= "это1" title="это2 " > и даже это3 < / a > и еще вот это4 и так далее) ;
    - одновременная работа 50 потоков;
    - использование HTTP прокси по импортируемому из файла списку;
    - список плохих ссылок (404 ошибок) и автоматическая перезагрузка(для сбивчивого пинга);
    - возможность ввода диапозона;
    - выбор методов GET или POST;
    - скрытие (тунелирование) трафика;
    - автозамены объектов на ходу;
    - ограничитель частей ссылок для запрета сайтов;
    - круговой обход ссылок в пределах домена(url, сайта);
    - извлечение объектов, содержащих промежуточное значение альфы @;
    - кодировки языка UTF-8 и др(кириллица, английский);
    - инструменты автоматизации приведения кода в 1 строку, облегчающий работу;
    - ограничитель таймаута обхода;
    - браузер логин и пароль;
    - установка приоритета;
    - + в бонус автогенератор чисел, автосборщик, подборщик и сортировщик списков - супер инструмент для профессионалов!;
    - модуль макросов для подстановки сложных объектов (типа &pref=xxx&pref2=yyy&pref3=zzz и т.д.);
    - фиксация ограничителя символов при неожиданных случаях;
    - множество количество полей(столбцов)

    еще есть Перейти по ссылке но цена кусается! Кто-то юзал эту прогу?
     
  4. ventus

    ventus Писатель

    Регистр.:
    1 июн 2013
    Сообщения:
    5
    Симпатии:
    0
    Если парсить с Content Downloader в таблицу, а потом обработать (сгенерировать дополнительные данные), то полученный файл вполне подходит для импорта на любой сайт.
     
  5. printsprint

    printsprint Постоялец

    Регистр.:
    22 июл 2009
    Сообщения:
    73
    Симпатии:
    28
    Если парсить с помощью Content Downloader, то в версии ULTIMATE предусмотрены дополнительные макросы
     
  6. meromax

    meromax

    Регистр.:
    19 янв 2013
    Сообщения:
    156
    Симпатии:
    22
    Если кому то нужно что то спарсить, обращайтесь
    Мелкие задачи сделаю за спасибо :)
     
  7. Yul717

    Yul717 Писатель

    Регистр.:
    11 май 2017
    Сообщения:
    1
    Симпатии:
    0
    Добрый день!
    Есть кое-какая задачка. Нужен парсер. Может кто-нибудь помочь?