Various Russian news source by bug_me_not

This commit is contained in:
Kovid Goyal 2014-02-24 08:43:40 +05:30
parent e5b381f460
commit d3a01fc18e
3 changed files with 127 additions and 0 deletions

View File

@ -0,0 +1,25 @@
# vim:fileencoding=utf-8
from calibre.web.feeds.news import BasicNewsRecipe
class AdjectiveSpecies(BasicNewsRecipe):
title = u'Эхо Москвы'
__author__ = 'bug_me_not'
cover_url = u'http://echo.msk.ru/i/logo.png'
description = 'Радиостанция Эхо Москвы'
publisher = 'Эхо Москвы'
category = 'news'
language = 'ru'
no_stylesheets = True
remove_javascript = True
oldest_article = 300
max_articles_per_feed = 100
remove_tags_before = dict(name='div', attrs={'class':'topic'})
remove_tags_after = dict(name='div', attrs={'class':'typical'})
remove_tags = [dict(name='div',attrs={'class':'addInNetBlock'}),
dict(name='div',attrs={'class':'flash'})]
feeds = [
(u'Интервью и передачи', u'http://echo.msk.ru/interview/rss-fulltext.xml'),
(u'Блоги', u'http://echo.msk.ru/blog/rss.xml')
]

View File

@ -0,0 +1,72 @@
# vim:fileencoding=utf-8
from calibre.web.feeds.news import BasicNewsRecipe
class AdjectiveSpecies(BasicNewsRecipe):
title = u'Российская Газета'
__author__ = 'bug_me_not'
cover_url = u'http://img.rg.ru/img/d/logo2012.png'
description = 'Российская Газета'
publisher = 'Правительство Российской Федерации'
category = 'news'
language = 'ru'
no_stylesheets = True
remove_javascript = True
oldest_article = 300
max_articles_per_feed = 100
remove_tags_before = dict(name='h1')
remove_tags_after = dict(name='div', attrs={'class': 'ar-citate'})
remove_tags = [dict(name='div', attrs={'class': 'insert_left'}),
dict(name='a', attrs={'href': '#comments'}),
dict(name='div', attrs={'class': 'clear'}),
dict(name='div', attrs={'class': 'ar-citate'}),
dict(name='div', attrs={'class': 'ar-social red'}),
dict(name='div', attrs={'class': 'clear clear-head'}), ]
feeds = [
(u'Все материалы', u'http://www.rg.ru/tema/rss.xml'),
(u'Еженедельный выпуск',
u'http://www.rg.ru/tema/izd-subbota/rss.xml'),
(u'Государство',
u'http://www.rg.ru/tema/gos/rss.xml'),
(u'Экономика',
u'http://www.rg.ru/tema/ekonomika/rss.xml'),
(u'Бизнес',
u'http://www.rg.ru/tema/izd-biznes/rss.xml'),
(u'В мире', u'http://www.rg.ru/tema/mir/rss.xml'),
(u'Происшествия',
u'http://www.rg.ru/tema/bezopasnost/rss.xml'),
(u'Общество',
u'http://www.rg.ru/tema/obshestvo/rss.xml'),
(u'Культура',
u'http://www.rg.ru/tema/kultura/rss.xml'),
(u'Спорт', u'http://www.rg.ru/tema/sport/rss.xml'),
(u'Документы', u'http://rg.ru/tema/doc-any/rss.xml'),
(u'РГ: Башкортостан',
u'http://www.rg.ru/org/filial/bashkortostan/rss.xml'),
(u'РГ: Волга-Кама',
u'http://www.rg.ru/org/filial/volga-kama/rss.xml'),
(u'РГ: Восточная Сибирь',
u'http://www.rg.ru/org/filial/enisey/rss.xml'),
(u'РГ: Дальний Восток',
u'http://www.rg.ru/org/filial/dvostok/rss.xml'),
(u'РГ: Кубань. Северный Кавказ',
u'http://www.rg.ru/org/filial/kuban/rss.xml'),
(u'РГ: Пермский край',
u'http://www.rg.ru/org/filial/permkray/rss.xml'),
(u'РГ: Приволжье',
u'http://www.rg.ru/org/filial/privolzhe/rss.xml'),
(u'РГ: Северо-Запад',
u'http://www.rg.ru/org/filial/szapad/rss.xml'),
(u'РГ: Сибирь',
u'http://www.rg.ru/org/filial/sibir/rss.xml'),
(u'РГ: Средняя Волга',
u'http://www.rg.ru/org/filial/svolga/rss.xml'),
(u'РГ: Урал и Западная Сибирь',
u'http://www.rg.ru/org/filial/ural/rss.xml'),
(u'РГ: Центральная Россия',
u'http://www.rg.ru/org/filial/roscentr/rss.xml'),
(u'РГ: Юг России',
u'http://www.rg.ru/org/filial/jugrossii/rss.xml'),
]

30
recipes/tjournal.recipe Normal file
View File

@ -0,0 +1,30 @@
# vim:fileencoding=utf-8
from calibre.web.feeds.news import BasicNewsRecipe
class AdjectiveSpecies(BasicNewsRecipe):
title = u'TJournal'
__author__ = 'bug_me_not'
description = 'TJOURNAL: издание о медиа, технологиях и трендах'
publisher = 'tjournal.ru'
category = 'news'
language = 'ru'
no_stylesheets = True
remove_javascript = True
oldest_article = 300
max_articles_per_feed = 100
remove_tags_before = dict(name='div', attrs={'class':'article grid-block'})
remove_tags_after = dict(name='div', attrs={'class':'comments grid-block'})
remove_tags = [dict(name='div',attrs={'class':'likes'}),
dict(name='div',attrs={'class':'adv'}),
dict(name='div',attrs={'class':'side grid-block'}),
dict(name='div',attrs={'class':'author'}),
dict(name='span',attrs={'class':'count-visits'}),
dict(name='a',attrs={'class':'count-comments'}),
dict(name='div',attrs={'class':'add-comment not-logined'}),
dict(name='div',attrs={'class':'newrphus'}),
dict(name='div',attrs={'class':'line-tags'}),
dict(name='div',attrs={'class':'line-banner-1'}),
dict(name='div',attrs={'class':'newrphus'})]
feeds = [(u'TJournal: последние новости', u'http://tjournal.ru/rss')]