Мануал по настройке рсс каналов

P

Pricol

Прохожие
Приветствую

Вопрос следуюбщего характераЁ

Как настраивать в грабере корректное грабание через РСС каналі?

то есть кто поделится советами и примерами на русские новостные сайты а не на забегорные которые есть в движке?
 
Настройка русских лент ничем не отличается от зарубежных.
Все аналогично.

в доке (что из форума) все почти расписано

Единственное в доке надо было дать пример регекспа замены урла на "версию для печати"
Вот часто встречающийся случай:

Страница для печати
Код:
/news/([0-9]+).html
менять на
Код:
/news/print.pl?id=$1
 
Pricol написал(а):
Приветствую

Вопрос следуюбщего характераЁ

Как настраивать в грабере корректное грабание через РСС каналі?

то есть кто поделится советами и примерами на русские новостные сайты а не на забегорные которые есть в движке?
ну вот пример:
1. Лента, одна штука... Например, эта: Для просмотра ссылки Войди или Зарегистрируйся
2. Добавляем в админке РСС-канал новый
3. Редактириум, по-шагам :)
4. Берем кусок из ленты:
Код:
[URL="http://shareleecher.com/component/option,com_rss/feed,RSS2.0/no_html,1/#"][B][FONT=Courier New][COLOR=#ff0000]-[/COLOR][/FONT][/B][/URL] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]item[/COLOR][COLOR=#0000ff]>[/COLOR]
[B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]title[/COLOR][COLOR=#0000ff]>[/COLOR][B]P. Diddy - Press Play (2006)[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]title[/COLOR][COLOR=#0000ff]>[/COLOR] 

[B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]link[/COLOR][COLOR=#0000ff]>[/COLOR][B][url]http://shareleecher.com/content/view/401/49/[/url][/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]link[/COLOR][COLOR=#0000ff]>[/COLOR] 

[B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]description[/COLOR][COLOR=#0000ff]>[/COLOR][B]Новый альбом известного рэп-артиста.[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]description[/COLOR][COLOR=#0000ff]>[/COLOR] 

[B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]category[/COLOR][COLOR=#0000ff]>[/COLOR][B]Обновления - Музыка[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]category[/COLOR][COLOR=#0000ff]>[/COLOR] 

[B][FONT=Courier New][COLOR=#ff0000] [/COLOR][/FONT][/B] [COLOR=#0000ff]<[/COLOR][COLOR=#990000]pubDate[/COLOR][COLOR=#0000ff]>[/COLOR][B]Thu, 19 Oct 2006 12:10:57 +0100[/B][COLOR=#0000ff]</[/COLOR][COLOR=#990000]pubDate[/COLOR][COLOR=#0000ff]>[/COLOR]
[COLOR=#0000ff]</<[/COLOR][COLOR=#990000]item[/COLOR][COLOR=#0000ff]>[/COLOR]
gfМеняем ненужное нам содержание тэгами:
{title}{link}{text}, остальное (все что не нужно) заменяем на тэг {skip}
6.Получившийся шаблон вставляем в окошко "Шаблон заголовков"
7ю Сохраняем, обновляем... Должно все работать
 
не, это некрасиво.
рсс он и так обрабатывает. без шаблона рсс-ленты.
просто указываешь какое поле в рсс отвечает за что.

там же в админке написано

Шаблон заголовков
Если задан, лента интерпретируется как html, а не rss:

то есть это поле для РСС лент не заполняйте

PS: читайте доки, они рулят !
Для просмотра ссылки Войди или Зарегистрируйся
 
someone написал(а):
не, это некрасиво.
рсс он и так обрабатывает. без шаблона рсс-ленты.
просто указываешь какое поле в рсс отвечает за что.

там же в админке написано

Шаблон заголовков
Если задан, лента интерпретируется как html, а не rss:

то есть это поле для РСС лент не заполняйте

PS: читайте доки, они рулят !
Для просмотра ссылки Войди или Зарегистрируйся
в том-то и дело, что в большинстве случаев, у новостных лент вся выдача через PHP... да и сами XML, если шаблоны не задавать, он не очень тщательно разбирает... :(
 
Возникает такте вопросі
1 выпадает такое RSS field rss_news_title error
хотя все сделано правильно и никаких траблов не должно быть

2 что делать если адрес сайта откуда грабаю newwws.ru а адрес картинки которая размещена sciens.newwws.ru Єто грабаетси нормально?

3 Как біть со страницей для печати? я теряюсь
есть такое
страница
Для просмотра ссылки Войди или Зарегистрируйся
страиница для печати
Для просмотра ссылки Войди или Зарегистрируйся

что на что менять?

и такое
страница новости
Для просмотра ссылки Войди или Зарегистрируйся
страница для печати
Для просмотра ссылки Войди или Зарегистрируйся

Что вставлять в данніх страниці для печати?
 
someone написал(а):
PS: читайте доки, они рулят !
Для просмотра ссылки Войди или Зарегистрируйся
За доки спасибо. А есть готовые решения каких то известных сайтов, а не только лент рсс новостных движков типа СNN?
 
someone написал(а):
Настройка русских лент ничем не отличается от зарубежных.
Все аналогично.

в доке (что из форума) все почти расписано

Единственное в доке надо было дать пример регекспа замены урла на "версию для печати"
Вот часто встречающийся случай:

Страница для печати
Код:
/news/([0-9]+).html
менять на
Код:
/news/print.pl?id=$1
Для ленты.ру
Для просмотра ссылки Войди или Зарегистрируйся
Страница для печати lenta.ru -> pda.lenta.ru
Шаблон текста новости:
{skip}
</h3></center>
{get}
<!-- publications, urls -->
{skip}
<remove><center>{skip}</center></remove>

Единственная проблема с этим сайтом, недоработка Newsgrabber
Например на ленте все фото к статьям имеют имя PICTURE.JPG, соответственно габер сохраняет только первую, а остальные выбрасывает.
Как сделать, чтобы он переименовывал изображения не знаю... если кто сталкивался - подскажите.
 
mikhael-sm написал(а):
Для ленты.ру
Для просмотра ссылки Войди или Зарегистрируйся
Страница для печати lenta.ru -> pda.lenta.ru
Шаблон текста новости:
{skip}
</h3></center>
{get}
<!-- publications, urls -->
{skip}
<remove><center>{skip}</center></remove>

Единственная проблема с этим сайтом, недоработка Newsgrabber
Например на ленте все фото к статьям имеют имя PICTURE.JPG, соответственно габер сохраняет только первую, а остальные выбрасывает.
Как сделать, чтобы он переименовывал изображения не знаю... если кто сталкивался - подскажите.
С твоим шаблоном при обновлении ошибка высветилась...
 
wwwish написал(а):
С твоим шаблоном при обновлении ошибка высветилась...
Там HTML код изменили... начало теперь надо искать по другому :)
 
Назад
Сверху