Update Neu Osnabrucker Zeitung

This commit is contained in:
Kovid Goyal 2013-10-03 09:20:03 +05:30
parent 31699d01d2
commit ea9a2dfd8f

View File

@ -1,49 +1,108 @@
# vim:fileencoding=utf-8 # vim:fileencoding=utf-8
from calibre.web.feeds.news import BasicNewsRecipe from calibre.web.feeds.news import BasicNewsRecipe
class AdvancedUserRecipe1344926684(BasicNewsRecipe): class AdvancedUserRecipe1380105782(BasicNewsRecipe):
title = u'Neue Osnabrücker Zeitung' title = u'Neue Osnabrücker Zeitung'
__author__ = 'Krittika Goyal' __author__ = 'vo_he'
oldest_article = 7 description = 'Online auch ohne IPhone'
max_articles_per_feed = 100 encoding = 'utf-8'
# auto_cleanup = True language = 'de'
no_stylesheets = True
use_embedded_content = False
language = 'de'
remove_javascript = True remove_javascript = True
no_stylesheets = True
oldest_article = 2
max_articles_per_feed = 100
cover_url = 'http://www.noz.de/bundles/nozplatform/images/logos/osnabruecker-zeitung.png'
remove_tags_before =dict(id='feedContent')
remove_tags_before =dict(id='headline')
remove_tags_after =dict(id='article-authorbox')
remove_tags_after =dict(id='footer-start')
remove_tags_after =dict(name='div', attrs={'class':'morelinks'})
keep_only_tags = [
dict(name='div', attrs={'class':'article'}),
dict(name='span', attrs={'id':'articletext'})
]
remove_tags = [ remove_tags = [
dict(name='div', attrs={'id':'retresco-title'}), dict(name='div', attrs={'id':'ui-datepicker-div'}),
dict(name='div', attrs={'class':'retresco-item s1 relative'}), dict(name='div', attrs={'class':'nav-second'}),
dict(name='a', attrs={'class':'medium2 largeSpaceTop icon'}), dict(name='div', attrs={'class':'nav-first'}),
dict(name='div', attrs={'class':'articleFunctions inlineTeaserRight'}), dict(name='div', attrs={'class':'icon-print'}),
dict(name='div', attrs={'class':'imageContainer '}), dict(name='div', attrs={'class':'social-button'}),
dict(name='div', attrs={'class':'imageContainer centerContainer'}), dict(name='div', attrs={'class':'social-media-bar'}),
dict(name='div', attrs={'class':'grid singleCol articleTeaser'}), dict(name='div', attrs={'class':'pull-right'}),
dict(name='h3', attrs={'class':'teaserRow'}), dict(name='div', attrs={'class':'btn btn-primary flat-button'}),
dict(name='div', attrs={'class':'related-comments'}), dict(name='div', attrs={'class':'carousel-wrapper'}),
dict(name='a', attrs={'class':' icon'}), dict(name='a', attrs={'class':'right-content merchandising hidden-tablet'}),
dict(name='a', attrs={'class':'right small'}), dict(name='div', attrs={'class':'border-circle pull-left'}),
dict(name='span', attrs={'class':'small block spaceBottom rectangleAd'}), dict(name='div', attrs={'class':'row show-grid general-infoimageContainer '}),
dict(name='div', attrs={'class':'location-list'}),
dict(name='div', attrs={'class':'block'}),
dict(name='div', attrs={'class':'furtherGalleries largeSpaceTop'}) dict(name='div', attrs={'class':'furtherGalleries largeSpaceTop'})
] ]
feeds = [(u'Lokales', u'http://www.noz.de/rss/Lokales'), feeds = [(u'Melle Mitte', u'http://www.noz.de/rss/ressort/Melle%20Mitte'),
(u'Vermischtes', u'http://www.noz.de/rss/Vermischtes'), (u'Melle Nord', u'http://www.noz.de/rss/ressort/Melle%20Nord'),
(u'Politik', u'http://www.noz.de/rss/Politik'), (u'Melle Sued', u'http://www.noz.de/rss/ressort/Melle%20S%C3%BCd'),
(u'Wirtschaft', u'http://www.noz.de/rss/Wirtschaft'), (u'Nordrhein Westfalen', u'http://www.noz.de/rss/ressort/Nordrhein-Westfalen'),
(u'Kultur', u'http://www.noz.de/rss/Kultur'), (u'Niedersachsen', u'http://www.noz.de/rss/ressort/Niedersachsen'),
(u'Medien', u'http://www.noz.de/rss/Medien'), (u'Vermischtes', u'http://www.noz.de/rss/ressort/Vermischtes'),
(u'Wissenschaft', u'http://www.noz.de/rss/wissenschaft'), (u'GutzuWissen', u'http://www.noz.de/rss/ressort/Gut%20zu%20Wissen'),
(u'Sport', u'http://www.noz.de/rss/Sport'), (u'Sport', u'http://www.noz.de/rss/ressort/Sport'),
(u'Computer', u'http://www.noz.de/rss/Computer'), (u'Kultur', u'http://www.noz.de/rss/ressort/Kultur'),
(u'Musik', u'http://www.noz.de/rss/Musik'), (u'Medien', u'http://www.noz.de/rss/ressort/Medien'),
(u'Szene', u'http://www.noz.de/rss/Szene'), (u'Belm', u'http://www.noz.de/rss/ressort/Belm'),
(u'Niedersachsen', u'http://www.noz.de/rss/Niedersachsen'), (u'Bissendorf', u' [url]http://www.noz.de/rss/ressort/Bissendorf[/url]'),
(u'Kino', u'http://www.noz.de/rss/Kino')] (u'Osnabrueck', u'http://www.noz.de/rss/ressort/Osnabr%C3%BCck'),
(u'Bad Essen', u'http://www.noz.de/rss/ressort/Bad%20Essen'),
(u'Politik', u'http://www.noz.de/rss/ressort/Politik'),
(u'Wirtschaft', u'http://www.noz.de/rss/ressort/Wirtschaft'),
#(u'Fussball', u'http:/www.noz.de/rss/ressort/Fußball'),
#(u'VfL Osnabrueck', u'http://www.noz.de/rss/ressort/VfL%20Osnabr%C3%BCck'),
#(u'SF Lotte', u'http://www.noz.de/rss/ressort/SF%20Lotte'),
#(u'SV Meppen', u'http://www.noz.de/rss/ressort/SV%20Meppen'),
#(u'Artland Dragons', u'http://www.noz.de/rss/ressort/Artland%20Dragons'),
#(u'Panthers', u'http://www.noz.de/rss/ressort/Panthers'),
(u'OS-Sport', u'http://www.noz.de/rss/ressort/OS-Sport'),
#(u'Emsland Sport', u'http://www.noz.de/rss/ressort/EL-Sport'),
#(u'Lingen', u'http://www.noz.de/rss/ressort/Lingen'),
#(u'Lohne', u'http://www.noz.de/rss/ressort/Lohne'),
#(u'Emsbueren', u'http://www.noz.de/rss/ressort/Emsb%C3%BCren'),
#(u'Salzbergen', u'http://www.noz.de/rss/ressort/Salzbergen'),
#(u'Spelle', u'http://www.noz.de/rss/ressort/Spelle'),
#(u'Freren', u'http://www.noz.de/rss/ressort/Freren'),
#(u'Lengerich', u'http://www.noz.de/rss/ressort/Lengerich'),
#(u'Bad Iburg', u'http://www.noz.de/rss/ressort/Bad%20Iburg'),
#(u'Bad Laer', u'http://www.noz.de/rss/ressort/Bad%20Laer'),
#(u'Bad Rothenfelde', u'http://www.noz.de/rss/ressort/Bad%20Rothenfelde'),
#(u'GMHütte', u'http://www.noz.de/rss/ressort/Georgsmarienh%C3%BCtte'),
#(u'Glandorf', u'http://www.noz.de/rss/ressort/Glandorf'),
#(u'Hagen', u'http://www.noz.de/rss/ressort/Hagen'),
#(u'Hasbergen', u'http://www.noz.de/rss/ressort/Hasbergen'),
#(u'Hilter', u'http://www.noz.de/rss/ressort/Hilter'),
#(u'Lotte', u'http://www.noz.de/rss/ressort/Lotte'),
#(u'Wallenhorst', u'http://www.noz.de/rss/ressort/Wallenhorst'),
#(u'Westerkappeln', u'http://www.noz.de/rss/ressort/Westerkappeln'),
#(u'Artland', u'http://www.noz.de/rss/ressort/Artland'),
#(u'Bersenbrück', u'http://www.noz.de/rss/ressort/Bersenbr%C3%BCck'),
#(u'Fürstenau', u'http://www.noz.de/rss/ressort/F%C3%BCrstenau'),
#(u'Neuenkirchen', u'http://www.noz.de/rss/ressort/Neuenkirchen'),
#(u'Lokalsport', u'http://www.noz.de/rss/ressort/Lokalsport%20Nordkreis'),
#(u'Bramsche', u'http://www.noz.de/rss/ressort/Bramsche'),
#(u'Bramsche Ortsteile', u'http://www.noz.de/rss/ressort/Bramscher%20Ortsteile'),
#(u'Neuenkirchen Vörden', u'http://www.noz.de/rss/ressort/Neuenkirchen-V%C3%B6rden'),
#(u'Papenburg', u'http://www.noz.de/rss/ressort/Papenburg'),
#(u'Dörpen', u'http://www.noz.de/rss/ressort/D%C3%B6rpen'),
#(u'Rhede', u'http://www.noz.de/rss/ressort/Rhede'),
#(u'Lathen', u'http://www.noz.de/rss/ressort/Lathen'),
#(u'Sögel', u'http://www.noz.de/rss/ressort/S%C3%B6gel'),
#(u'Nordhümmling', u'http://www.noz.de/rss/ressort/Nordh%C3%BCmmling'),
#(u'Werlte', u'http://www.noz.de/rss/ressort/Werlte'),
#(u'Westoverledingen', u'http://www.noz.de/rss/ressort/Westoverledingen'),
#(u'Geeste', u'http://www.noz.de/rss/ressort/Geeste'),
#(u'Haren', u'http://www.noz.de/rss/ressort/Haren'),
#(u'Haselünne', u'http://www.noz.de/rss/ressort/Hasel%C3%BCnne'),
#(u'Herzlake', u'http://www.noz.de/rss/ressort/Herzlake'),
#(u'Meppen', u'http://www.noz.de/rss/ressort/Meppen'),
#(u'Twist', u'http://www.noz.de/rss/ressort/Twist'),
#(u'Bohmte', u'http://www.noz.de/rss/ressort/Bohmte'),
#(u'Ostercappeln', u'http://www.noz.de/rss/ressort/Ostercappeln')
]