• DONATE to NULLED!
    Вы можете помочь Форуму и команде, поддержать финансово.
    starwanderer - модератор этого раздела будет Вам благодарен!

Плагин WP RSS GRABER

Статус
В этой теме нельзя размещать новые ответы.
В общем моя практика с Feedmaster`ом:

К примеру, беру один блог на blogspot : example1.blogspot.com - беру с него feed - все работает идеально.
беру другой блог на blogspot : example2.blogspot.com - ни в какую, ни статика, ни feed. В чем дело хер знает, но при прочих равных условиях разные рез-ты.

Вот мой пример граба rss:
статика: Для просмотра ссылки Войди или Зарегистрируйся
методика:

1.Тащим заголовок (Static page pattern:): Смотрим исход код страницы
Код:
<h2 class="news">26.03.2008 // <em><a href="/opt/news/">Оптовик Бизнес Маркет</a></em></h2>
<span class="newstext"><a href="/opt/news/1720080326228/index.php">Увеличено производство мяса и молока</a></span>
<h2 class="news">26.03.2008 // <em><a href="/sport/news/">Спорт БМ</a></em></h2>
<span class="newstext"><a href="/sport/news/10920080326441/index.php">Победила МИЛОСТЬ</a></span>
<h2 class="news">25.03.2008 // <em><a href="/comar/news/">Компьютер Бизнес Маркет</a></em></h2>
<span class="newstext"><a href="/comar/news/13200803251694/index.php">LED-функции у контактной линзы</a></span>
-здесь заголовки в теге <a>.
соответственно получаем:
<span class="newstext">{get}</span>
т.е. {get }=<a href="/comar/news/13200803251694/index.php">LED-функции у контактной линзы</a>

2. Тащим статью (Get content:(
Исходный код:
Код:
<h4 class="article">
Рубрика: <a href="#">Новости</a><br>
Опубликовано: <strong>02.04.2008</strong><br>
Автор / Источник: <strong>Спорт Бизнес Маркет</strong></h4>

<span class="pagearticle">
[B]<br><b>5 и 6 апреля 2008 года в Санкт-Петербурге состоится XVI международный турнир по дзюдо "Невские 
бла-бла-бла.... [/B]
</span>

</td>
    <td width="1" class="border" valign="top"><img src="/img/1x1wt.gif" width="1" height="17" border="0"></td>
    <td width="328" valign="top"> 
      <!-- блок СТАТЬИ -->
То, что нам мадо выделил жирным.
Берем ближайший тег <span class="pagearticle"> смотрим чтоб выше по коду он не повторялся.
После текста статьи берем тег, который не встречается в статье </span>
получаем:
<span class="pagearticle">
{get}
</span>

Результат:
[link] => Для просмотра ссылки Войди или Зарегистрируйся
[home] => Для просмотра ссылки Войди или Зарегистрируйся
[thumbnail] =>
[title] => 21-22 марта в Малайзии пройдет III этап молодежной гоночной серии GP2 Asia
[etitle] => marta-v-malayzii-proydet-iii-etap-molodezhnoy-gonochnoy-serii-gp-asia
[text] => <br><i>После успешных выступлений на предыдущих гонках в индонезийском Сентуле россиянин Виталий Пет.....
Images count: не трогаю
Published?(or Draft) галочку снимаю, ибо статью правлю сам.

Готово...если не понятно, показывайте, что не получается попробую помочь.
 
В общем моя практика с Feedmaster`ом: ...
Каким-то чудом и у меня подобным образом дело пошло. Видимо сначала наткнулся на неск заведомо неудачных лент (из тех - что ни в какую) и думал - всё так. Однако начав с другими - приспособился. Даже некоторые типы принимаемых кусков кода заприметил.
Однако - есть момент, когда в некот лентах между заголовком всякую лабуду типа: рез-т опроса, дата поста на том хосте, комменты не в тему вставляет. Как такие куски ненужного кода из середины поста исключать? ;)
 
Однако - есть момент, когда в некот лентах между заголовком всякую лабуду типа: рез-т опроса, дата поста на том хосте, комменты не в тему вставляет. Как такие куски ненужного кода из середины поста исключать?
функции {skip}(пропуск кода), насколько я понимаю в FM нет.
но ведь дата и каменты ставятся непосредственно в теле всей страницы между заголовком и нужным нам телом статьи. Так бери теги самые близкие к телу статьи (как показано в моем примере выше).
На самом же деле в некоторых моих источниках самые близкие теги к тексту - не парсит. Немного расширив дипазон парсинга(обычно в верх по коду) начинает грабить, а потом просто руками вырезаю лишнее.
 
Есть предложение. Может здесь также будем рассматривать проблемы граббинга с того или иного фида или сайта? Ведь у многих из нас есть подобные затруднения, когда хочеться граббить новости именно с "этого" сайта.

Имхо, будет полезно для всех.. больше примеров, понятней станет как настраивать сигнатуру.
 
  • Заблокирован
  • #97
Помоги плз, разобраться WP RSS GRABER никак не получаеться настроить, в долгу не останусь . Сообщайте в личку свою асю
 
Помоги плз, разобраться WP RSS GRABER никак не получаеться настроить, в долгу не останусь . Сообщайте в личку свою асю
Вот я и предлагаю разбираться вместе. Оставь url источника под hide, и попробуем вместе решить затруднение.
 
Есть предложение. Может здесь также будем рассматривать проблемы граббинга с того или иного фида или сайта? Ведь у многих из нас есть подобные затруднения, когда хочеться граббить новости именно с "этого" сайта.

Имхо, будет полезно для всех.. больше примеров, понятней станет как настраивать сигнатуру.
Это конечно дельная идея я полностью поддерживаю, но ведь это получится что люди будут палить свои уникальные, еще 20 раз не перетащенные на другие сайты редкие источники. Ведь к примеру ixbt, lenta и т.д. попсовые и раскрученные тащатся элементарно. Хотя может и вопросы по ним у кого возникнут
 
К примеру у меня с лентой дружба не получилась;) правда это было до того, как более-менее разобрался с сигнатурой. Т ч думаю настрою, а вот федд 3dnews у меня ни грабиться ни в какую.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху