rewrite rynek_infrastruktury recipe

This commit is contained in:
Tomasz Długosz 2018-10-13 21:48:30 +02:00
parent 7cfa28eb25
commit 356db86058

View File

@ -17,26 +17,22 @@ class prawica_recipe(BasicNewsRecipe):
description = u'Portal "Rynek Infrastruktury" to źródło informacji o kluczowych elementach polskiej gospodarki: drogach, kolei, lotniskach, portach, telekomunikacji, energetyce, prawie i polityce, wzmocnione eksperckimi komentarzami kluczowych analityków.' # noqa description = u'Portal "Rynek Infrastruktury" to źródło informacji o kluczowych elementach polskiej gospodarki: drogach, kolei, lotniskach, portach, telekomunikacji, energetyce, prawie i polityce, wzmocnione eksperckimi komentarzami kluczowych analityków.' # noqa
remove_empty_feeds = True remove_empty_feeds = True
oldest_article = 1 oldest_article = 1
max_articles_per_feed = 100 max_articles_per_feed = 50
remove_javascript = True remove_javascript = True
no_stylesheets = True no_stylesheets = True
feeds = [ feeds = [
(u'Drogi', u'http://www.rynekinfrastruktury.pl/rss/41'), (u'Drogi', u'http://www.rynekinfrastruktury.pl/rss/drogi.xml'),
(u'Lotniska', u'http://www.rynekinfrastruktury.pl/rss/42'), (u'Kolej', u'http://www.rynekinfrastruktury.pl/rss/kolej.xml'),
(u'Kolej', u'http://www.rynekinfrastruktury.pl/rss/37'), (u'Energetyka', u'http://www.rynekinfrastruktury.pl/rss/energetyka.xml')
(u'Energetyka', u'http://www.rynekinfrastruktury.pl/rss/30'), # no news in these feeds since 4 years:
(u'Telekomunikacja', u'http://www.rynekinfrastruktury.pl/rss/31'), #(u'Porty i lotniska', u'http://www.rynekinfrastruktury.pl/rss/porty-i-lotniska.xml'),
(u'Porty', u'http://www.rynekinfrastruktury.pl/rss/32'), #(u'Komentarze', u'http://www.rynekinfrastruktury.pl/rss/komentarze-i-felietony.xml'),
(u'Prawo i polityka', u'http://www.rynekinfrastruktury.pl/rss/47'),
(u'Komentarze', u'http://www.rynekinfrastruktury.pl/rss/38'),
] ]
keep_only_tags = [] keep_only_tags = [
keep_only_tags.append(dict(name='div', attrs={'class': 'articleContent'})) dict(name='h1', attrs={'class': 'wiadTit'}),
dict(name='div', attrs={'class': ['wiadSzczegol', 'multimediaWiadomosci', 'wiadTresc']})
]
remove_tags = [] remove_tags = [dict(name='span', attrs={'class': 'kom'})]
remove_tags.append(dict(name='span', attrs={'class': 'date'}))
def print_version(self, url):
return url.replace('http://www.rynekinfrastruktury.pl/artykul/', 'http://www.rynekinfrastruktury.pl/artykul/drukuj/')