diff --git a/recipes/helsingin_sanomat.recipe b/recipes/helsingin_sanomat.recipe index 6099a1fda8..76c6b3fb08 100644 --- a/recipes/helsingin_sanomat.recipe +++ b/recipes/helsingin_sanomat.recipe @@ -3,7 +3,7 @@ from calibre.web.feeds.news import BasicNewsRecipe class AdvancedUserRecipe1298137661(BasicNewsRecipe): title = u'Helsingin Sanomat' __author__ = 'oneillpt' - language = 'fi' + language = 'fi' oldest_article = 7 max_articles_per_feed = 100 no_stylesheets = True @@ -11,21 +11,12 @@ class AdvancedUserRecipe1298137661(BasicNewsRecipe): conversion_options = { 'linearize_tables' : True } - remove_tags = [ - dict(name='a', attrs={'id':'articleCommentUrl'}), - dict(name='p', attrs={'class':'newsSummary'}), - dict(name='div', attrs={'class':'headerTools'}) - ] + keep_only_tags = [dict(name='div', attrs={'id':'main-content'}), + dict(name='div', attrs={'class':'contentNewsArticle'})] - feeds = [(u'Uutiset - HS.fi', u'http://www.hs.fi/uutiset/rss/'), (u'Politiikka - HS.fi', u'http://www.hs.fi/politiikka/rss/'), + feeds = [(u'Uutiset - HS.fi', u'http://www.hs.fi/uutiset/rss/') +, (u'Politiikka - HS.fi', u'http://www.hs.fi/politiikka/rss/'), (u'Ulkomaat - HS.fi', u'http://www.hs.fi/ulkomaat/rss/'), (u'Kulttuuri - HS.fi', u'http://www.hs.fi/kulttuuri/rss/'), (u'Kirjat - HS.fi', u'http://www.hs.fi/kulttuuri/kirjat/rss/'), (u'Elokuvat - HS.fi', u'http://www.hs.fi/kulttuuri/elokuvat/rss/') ] - def print_version(self, url): - j = url.rfind("/") - s = url[j:] - i = s.rfind("?ref=rss") - if i > 0: - s = s[:i] - return "http://www.hs.fi/tulosta" + s