[Архив] Парсер Google

Статус
В этой теме нельзя размещать новые ответы.

morze

Постоялец
Регистрация
9 Окт 2006
Сообщения
74
Реакции
51
Фичи:
1. высокая отказоустойчивость, скрипт завершает работу лишь при полном дауне проксей в прокси-листе
2. встроенный прокси-чекер​
Установка:
1. скопируйте содержимое дистрибутива на сервер
2. установите для папки config и всех txt-файлов внутри нее права 777
3. все… приятной работы!​
Работа:
Интерфейс интуитивно понятен, сложностей возникнуть не должно.
Удачи тебе, Google!


 
У гугла изменился код

Сразу идем в код parse.php и меняем:
PHP:
$start += strlen('<p class=g><a class=l href="');
на такое
PHP:
$start += strlen('<div class=g><a class=l href="');
 
В общем забираю свои слова назад.
Оболочка скрипта пашет. Но... на парсить не удается ничего. Делается просто пустой файл parsing_1212....txt
 
Пишет мол "Плохая база прокси." хотя половину проксиков на 100% рабочие.
 
мда вам же сказали что на что в коде надо поменять если этого несделать парсер не будет работать так как произошли некоторые изминения в форме кода выдачи гугли поетому парсер и не может ничо найти
P.S. Бывают же тупые люди!
 
До замены не парсил,
и после замены не парсит.
из README:
высокая отказоустойчивость, скрипт завершает работу лишь при полном дауне проксей в прокси-листе
лажа
 
аналогично, ничего не пашет ни перед заменой, ни после.
 
мдя у меня аналогичная проблемма.
 
ну его в одно место. Парсер МАНГО - рулез
 
stud2000 написал(а):
У гугла изменился код

Сразу идем в код parse.php и меняем:
PHP:
$start += strlen('<p class=g><a class=l href="');
на такое
PHP:
$start += strlen('<div class=g><a class=l href="');
это не поможет
PHP:
<p class=g>
нужно просто удалить и все, либо заменить на
PHP:
<div class=g><h2 class=r>
так как там не просто изменение было тэга но и добавление <h2 class=r> и все будет работать... только вот однопоточные парсеры это как бы устарело...
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху