diff --git a/recipes/heise_online.recipe b/recipes/heise_online.recipe index f83ff8126b..338b54782c 100644 --- a/recipes/heise_online.recipe +++ b/recipes/heise_online.recipe @@ -1,7 +1,9 @@ from calibre.web.feeds.news import BasicNewsRecipe +import re + class AdvancedUserRecipe(BasicNewsRecipe): - title = 'Heise-online' + title = 'heise online' description = 'News vom Heise-Verlag' __author__ = 'schuster' use_embedded_content = False @@ -12,10 +14,11 @@ class AdvancedUserRecipe(BasicNewsRecipe): remove_empty_feeds = True timeout = 5 no_stylesheets = True + encoding = 'utf-8' remove_tags_after = dict(name ='p', attrs={'class':'editor'}) - remove_tags = [dict(id='navi_top_container'), + remove_tags = [{'class':'navi_top_container'}, dict(id='navi_bottom'), dict(id='mitte_rechts'), dict(id='navigation'), @@ -25,28 +28,28 @@ class AdvancedUserRecipe(BasicNewsRecipe): dict(id='content_foren'), dict(id='seiten_navi'), dict(id='adbottom'), - dict(id='sitemap')] + dict(id='sitemap'), + dict(name='a', href=re.compile(r'^/([a-zA-Z]+/)?')), + ] feeds = [ ('Newsticker', 'http://www.heise.de/newsticker/heise.rdf'), - ('Auto', 'http://www.heise.de/autos/rss/news.rdf'), - ('Foto ', 'http://www.heise.de/foto/rss/news-atom.xml'), - ('Mac&i', 'http://www.heise.de/mac-and-i/news.rdf'), - ('Mobile ', 'http://www.heise.de/mobil/newsticker/heise-atom.xml'), - ('Netz ', 'http://www.heise.de/netze/rss/netze-atom.xml'), - ('Open ', 'http://www.heise.de/open/news/news-atom.xml'), - ('Resale ', 'http://www.heise.de/resale/rss/resale.rdf'), - ('Security ', 'http://www.heise.de/security/news/news-atom.xml'), - ('C`t', 'http://www.heise.de/ct/rss/artikel-atom.xml'), ('iX', 'http://www.heise.de/ix/news/news.rdf'), - ('Mach-flott', 'http://www.heise.de/mach-flott/rss/mach-flott-atom.xml'), + ('Technology Review', 'http://www.heise.de/tr/news-atom.xml'), + ('mobil', 'http://www.heise.de/mobil/newsticker/heise-atom.xml'), + ('Security', 'http://www.heise.de/security/news/news-atom.xml'), + ('Netze', 'http://www.heise.de/netze/rss/netze-atom.xml'), + ('Open Source', 'http://www.heise.de/open/news/news-atom.xml'), + ('Resale ', 'http://www.heise.de/resale/rss/resale.rdf'), + ('Foto ', 'http://www.heise.de/foto/rss/news-atom.xml'), + ('Autos', 'http://www.heise.de/autos/rss/news.rdf'), + ('Mac & i', 'http://www.heise.de/mac-and-i/news.rdf'), ('Blog: Babel-Bulletin', 'http://www.heise.de/developer/rss/babel-bulletin/blog.rdf'), ('Blog: Der Dotnet-Doktor', 'http://www.heise.de/developer/rss/dotnet-doktor/blog.rdf'), ('Blog: Bernds Management-Welt', 'http://www.heise.de/developer/rss/bernds-management-welt/blog.rdf'), - ('Blog: IT conversation', 'http://www.heise.de/developer/rss/world-of-it/blog.rdf'), + ('Blog: The World of IT', 'http://www.heise.de/developer/rss/world-of-it/blog.rdf'), ('Blog: Kais bewegtes Web', 'http://www.heise.de/developer/rss/kais-bewegtes-web/blog.rdf') -] + ] def print_version(self, url): return url + '?view=print' -