From ea9a2dfd8ff44285e867018b470276846f2f2b37 Mon Sep 17 00:00:00 2001 From: Kovid Goyal Date: Thu, 3 Oct 2013 09:20:03 +0530 Subject: [PATCH] Update Neu Osnabrucker Zeitung --- recipes/neu_osnabrucker_zeitung.recipe | 139 ++++++++++++++++++------- 1 file changed, 99 insertions(+), 40 deletions(-) diff --git a/recipes/neu_osnabrucker_zeitung.recipe b/recipes/neu_osnabrucker_zeitung.recipe index dc6a36237e..011d97f801 100644 --- a/recipes/neu_osnabrucker_zeitung.recipe +++ b/recipes/neu_osnabrucker_zeitung.recipe @@ -1,49 +1,108 @@ # vim:fileencoding=utf-8 - from calibre.web.feeds.news import BasicNewsRecipe -class AdvancedUserRecipe1344926684(BasicNewsRecipe): - title = u'Neue Osnabrücker Zeitung' - __author__ = 'Krittika Goyal' - oldest_article = 7 - max_articles_per_feed = 100 - # auto_cleanup = True - no_stylesheets = True - use_embedded_content = False - language = 'de' +class AdvancedUserRecipe1380105782(BasicNewsRecipe): + title = u'Neue Osnabrücker Zeitung' + __author__ = 'vo_he' + description = 'Online auch ohne IPhone' + encoding = 'utf-8' + language = 'de' remove_javascript = True + no_stylesheets = True + + oldest_article = 2 + max_articles_per_feed = 100 + cover_url = 'http://www.noz.de/bundles/nozplatform/images/logos/osnabruecker-zeitung.png' + + remove_tags_before =dict(id='feedContent') + remove_tags_before =dict(id='headline') + + remove_tags_after =dict(id='article-authorbox') + remove_tags_after =dict(id='footer-start') + remove_tags_after =dict(name='div', attrs={'class':'morelinks'}) - keep_only_tags = [ - dict(name='div', attrs={'class':'article'}), - dict(name='span', attrs={'id':'articletext'}) - ] remove_tags = [ - dict(name='div', attrs={'id':'retresco-title'}), - dict(name='div', attrs={'class':'retresco-item s1 relative'}), - dict(name='a', attrs={'class':'medium2 largeSpaceTop icon'}), - dict(name='div', attrs={'class':'articleFunctions inlineTeaserRight'}), - dict(name='div', attrs={'class':'imageContainer '}), - dict(name='div', attrs={'class':'imageContainer centerContainer'}), - dict(name='div', attrs={'class':'grid singleCol articleTeaser'}), - dict(name='h3', attrs={'class':'teaserRow'}), - dict(name='div', attrs={'class':'related-comments'}), - dict(name='a', attrs={'class':' icon'}), - dict(name='a', attrs={'class':'right small'}), - dict(name='span', attrs={'class':'small block spaceBottom rectangleAd'}), + dict(name='div', attrs={'id':'ui-datepicker-div'}), + dict(name='div', attrs={'class':'nav-second'}), + dict(name='div', attrs={'class':'nav-first'}), + dict(name='div', attrs={'class':'icon-print'}), + dict(name='div', attrs={'class':'social-button'}), + dict(name='div', attrs={'class':'social-media-bar'}), + dict(name='div', attrs={'class':'pull-right'}), + dict(name='div', attrs={'class':'btn btn-primary flat-button'}), + dict(name='div', attrs={'class':'carousel-wrapper'}), + dict(name='a', attrs={'class':'right-content merchandising hidden-tablet'}), + dict(name='div', attrs={'class':'border-circle pull-left'}), + dict(name='div', attrs={'class':'row show-grid general-infoimageContainer '}), + dict(name='div', attrs={'class':'location-list'}), + dict(name='div', attrs={'class':'block'}), dict(name='div', attrs={'class':'furtherGalleries largeSpaceTop'}) ] - feeds = [(u'Lokales', u'http://www.noz.de/rss/Lokales'), -(u'Vermischtes', u'http://www.noz.de/rss/Vermischtes'), -(u'Politik', u'http://www.noz.de/rss/Politik'), -(u'Wirtschaft', u'http://www.noz.de/rss/Wirtschaft'), -(u'Kultur', u'http://www.noz.de/rss/Kultur'), -(u'Medien', u'http://www.noz.de/rss/Medien'), -(u'Wissenschaft', u'http://www.noz.de/rss/wissenschaft'), -(u'Sport', u'http://www.noz.de/rss/Sport'), -(u'Computer', u'http://www.noz.de/rss/Computer'), -(u'Musik', u'http://www.noz.de/rss/Musik'), -(u'Szene', u'http://www.noz.de/rss/Szene'), -(u'Niedersachsen', u'http://www.noz.de/rss/Niedersachsen'), -(u'Kino', u'http://www.noz.de/rss/Kino')] - + feeds = [(u'Melle Mitte', u'http://www.noz.de/rss/ressort/Melle%20Mitte'), + (u'Melle Nord', u'http://www.noz.de/rss/ressort/Melle%20Nord'), + (u'Melle Sued', u'http://www.noz.de/rss/ressort/Melle%20S%C3%BCd'), + (u'Nordrhein Westfalen', u'http://www.noz.de/rss/ressort/Nordrhein-Westfalen'), + (u'Niedersachsen', u'http://www.noz.de/rss/ressort/Niedersachsen'), + (u'Vermischtes', u'http://www.noz.de/rss/ressort/Vermischtes'), + (u'GutzuWissen', u'http://www.noz.de/rss/ressort/Gut%20zu%20Wissen'), + (u'Sport', u'http://www.noz.de/rss/ressort/Sport'), + (u'Kultur', u'http://www.noz.de/rss/ressort/Kultur'), + (u'Medien', u'http://www.noz.de/rss/ressort/Medien'), + (u'Belm', u'http://www.noz.de/rss/ressort/Belm'), + (u'Bissendorf', u' [url]http://www.noz.de/rss/ressort/Bissendorf[/url]'), + (u'Osnabrueck', u'http://www.noz.de/rss/ressort/Osnabr%C3%BCck'), + (u'Bad Essen', u'http://www.noz.de/rss/ressort/Bad%20Essen'), + (u'Politik', u'http://www.noz.de/rss/ressort/Politik'), + (u'Wirtschaft', u'http://www.noz.de/rss/ressort/Wirtschaft'), +#(u'Fussball', u'http:/www.noz.de/rss/ressort/Fußball'), +#(u'VfL Osnabrueck', u'http://www.noz.de/rss/ressort/VfL%20Osnabr%C3%BCck'), +#(u'SF Lotte', u'http://www.noz.de/rss/ressort/SF%20Lotte'), +#(u'SV Meppen', u'http://www.noz.de/rss/ressort/SV%20Meppen'), +#(u'Artland Dragons', u'http://www.noz.de/rss/ressort/Artland%20Dragons'), +#(u'Panthers', u'http://www.noz.de/rss/ressort/Panthers'), +(u'OS-Sport', u'http://www.noz.de/rss/ressort/OS-Sport'), +#(u'Emsland Sport', u'http://www.noz.de/rss/ressort/EL-Sport'), +#(u'Lingen', u'http://www.noz.de/rss/ressort/Lingen'), +#(u'Lohne', u'http://www.noz.de/rss/ressort/Lohne'), +#(u'Emsbueren', u'http://www.noz.de/rss/ressort/Emsb%C3%BCren'), +#(u'Salzbergen', u'http://www.noz.de/rss/ressort/Salzbergen'), +#(u'Spelle', u'http://www.noz.de/rss/ressort/Spelle'), +#(u'Freren', u'http://www.noz.de/rss/ressort/Freren'), +#(u'Lengerich', u'http://www.noz.de/rss/ressort/Lengerich'), +#(u'Bad Iburg', u'http://www.noz.de/rss/ressort/Bad%20Iburg'), +#(u'Bad Laer', u'http://www.noz.de/rss/ressort/Bad%20Laer'), +#(u'Bad Rothenfelde', u'http://www.noz.de/rss/ressort/Bad%20Rothenfelde'), +#(u'GMHütte', u'http://www.noz.de/rss/ressort/Georgsmarienh%C3%BCtte'), +#(u'Glandorf', u'http://www.noz.de/rss/ressort/Glandorf'), +#(u'Hagen', u'http://www.noz.de/rss/ressort/Hagen'), +#(u'Hasbergen', u'http://www.noz.de/rss/ressort/Hasbergen'), +#(u'Hilter', u'http://www.noz.de/rss/ressort/Hilter'), +#(u'Lotte', u'http://www.noz.de/rss/ressort/Lotte'), +#(u'Wallenhorst', u'http://www.noz.de/rss/ressort/Wallenhorst'), +#(u'Westerkappeln', u'http://www.noz.de/rss/ressort/Westerkappeln'), +#(u'Artland', u'http://www.noz.de/rss/ressort/Artland'), +#(u'Bersenbrück', u'http://www.noz.de/rss/ressort/Bersenbr%C3%BCck'), +#(u'Fürstenau', u'http://www.noz.de/rss/ressort/F%C3%BCrstenau'), +#(u'Neuenkirchen', u'http://www.noz.de/rss/ressort/Neuenkirchen'), +#(u'Lokalsport', u'http://www.noz.de/rss/ressort/Lokalsport%20Nordkreis'), +#(u'Bramsche', u'http://www.noz.de/rss/ressort/Bramsche'), +#(u'Bramsche Ortsteile', u'http://www.noz.de/rss/ressort/Bramscher%20Ortsteile'), +#(u'Neuenkirchen Vörden', u'http://www.noz.de/rss/ressort/Neuenkirchen-V%C3%B6rden'), +#(u'Papenburg', u'http://www.noz.de/rss/ressort/Papenburg'), +#(u'Dörpen', u'http://www.noz.de/rss/ressort/D%C3%B6rpen'), +#(u'Rhede', u'http://www.noz.de/rss/ressort/Rhede'), +#(u'Lathen', u'http://www.noz.de/rss/ressort/Lathen'), +#(u'Sögel', u'http://www.noz.de/rss/ressort/S%C3%B6gel'), +#(u'Nordhümmling', u'http://www.noz.de/rss/ressort/Nordh%C3%BCmmling'), +#(u'Werlte', u'http://www.noz.de/rss/ressort/Werlte'), +#(u'Westoverledingen', u'http://www.noz.de/rss/ressort/Westoverledingen'), +#(u'Geeste', u'http://www.noz.de/rss/ressort/Geeste'), +#(u'Haren', u'http://www.noz.de/rss/ressort/Haren'), +#(u'Haselünne', u'http://www.noz.de/rss/ressort/Hasel%C3%BCnne'), +#(u'Herzlake', u'http://www.noz.de/rss/ressort/Herzlake'), +#(u'Meppen', u'http://www.noz.de/rss/ressort/Meppen'), +#(u'Twist', u'http://www.noz.de/rss/ressort/Twist'), +#(u'Bohmte', u'http://www.noz.de/rss/ressort/Bohmte'), +#(u'Ostercappeln', u'http://www.noz.de/rss/ressort/Ostercappeln') +]