Update Neu Osnabrucker Zeitung

This commit is contained in:
Kovid Goyal 2013-10-03 09:20:03 +05:30
parent 31699d01d2
commit ea9a2dfd8f

View File

@ -1,49 +1,108 @@
# vim:fileencoding=utf-8
from calibre.web.feeds.news import BasicNewsRecipe
class AdvancedUserRecipe1344926684(BasicNewsRecipe):
class AdvancedUserRecipe1380105782(BasicNewsRecipe):
title = u'Neue Osnabrücker Zeitung'
__author__ = 'Krittika Goyal'
oldest_article = 7
max_articles_per_feed = 100
# auto_cleanup = True
no_stylesheets = True
use_embedded_content = False
__author__ = 'vo_he'
description = 'Online auch ohne IPhone'
encoding = 'utf-8'
language = 'de'
remove_javascript = True
no_stylesheets = True
oldest_article = 2
max_articles_per_feed = 100
cover_url = 'http://www.noz.de/bundles/nozplatform/images/logos/osnabruecker-zeitung.png'
remove_tags_before =dict(id='feedContent')
remove_tags_before =dict(id='headline')
remove_tags_after =dict(id='article-authorbox')
remove_tags_after =dict(id='footer-start')
remove_tags_after =dict(name='div', attrs={'class':'morelinks'})
keep_only_tags = [
dict(name='div', attrs={'class':'article'}),
dict(name='span', attrs={'id':'articletext'})
]
remove_tags = [
dict(name='div', attrs={'id':'retresco-title'}),
dict(name='div', attrs={'class':'retresco-item s1 relative'}),
dict(name='a', attrs={'class':'medium2 largeSpaceTop icon'}),
dict(name='div', attrs={'class':'articleFunctions inlineTeaserRight'}),
dict(name='div', attrs={'class':'imageContainer '}),
dict(name='div', attrs={'class':'imageContainer centerContainer'}),
dict(name='div', attrs={'class':'grid singleCol articleTeaser'}),
dict(name='h3', attrs={'class':'teaserRow'}),
dict(name='div', attrs={'class':'related-comments'}),
dict(name='a', attrs={'class':' icon'}),
dict(name='a', attrs={'class':'right small'}),
dict(name='span', attrs={'class':'small block spaceBottom rectangleAd'}),
dict(name='div', attrs={'id':'ui-datepicker-div'}),
dict(name='div', attrs={'class':'nav-second'}),
dict(name='div', attrs={'class':'nav-first'}),
dict(name='div', attrs={'class':'icon-print'}),
dict(name='div', attrs={'class':'social-button'}),
dict(name='div', attrs={'class':'social-media-bar'}),
dict(name='div', attrs={'class':'pull-right'}),
dict(name='div', attrs={'class':'btn btn-primary flat-button'}),
dict(name='div', attrs={'class':'carousel-wrapper'}),
dict(name='a', attrs={'class':'right-content merchandising hidden-tablet'}),
dict(name='div', attrs={'class':'border-circle pull-left'}),
dict(name='div', attrs={'class':'row show-grid general-infoimageContainer '}),
dict(name='div', attrs={'class':'location-list'}),
dict(name='div', attrs={'class':'block'}),
dict(name='div', attrs={'class':'furtherGalleries largeSpaceTop'})
]
feeds = [(u'Lokales', u'http://www.noz.de/rss/Lokales'),
(u'Vermischtes', u'http://www.noz.de/rss/Vermischtes'),
(u'Politik', u'http://www.noz.de/rss/Politik'),
(u'Wirtschaft', u'http://www.noz.de/rss/Wirtschaft'),
(u'Kultur', u'http://www.noz.de/rss/Kultur'),
(u'Medien', u'http://www.noz.de/rss/Medien'),
(u'Wissenschaft', u'http://www.noz.de/rss/wissenschaft'),
(u'Sport', u'http://www.noz.de/rss/Sport'),
(u'Computer', u'http://www.noz.de/rss/Computer'),
(u'Musik', u'http://www.noz.de/rss/Musik'),
(u'Szene', u'http://www.noz.de/rss/Szene'),
(u'Niedersachsen', u'http://www.noz.de/rss/Niedersachsen'),
(u'Kino', u'http://www.noz.de/rss/Kino')]
feeds = [(u'Melle Mitte', u'http://www.noz.de/rss/ressort/Melle%20Mitte'),
(u'Melle Nord', u'http://www.noz.de/rss/ressort/Melle%20Nord'),
(u'Melle Sued', u'http://www.noz.de/rss/ressort/Melle%20S%C3%BCd'),
(u'Nordrhein Westfalen', u'http://www.noz.de/rss/ressort/Nordrhein-Westfalen'),
(u'Niedersachsen', u'http://www.noz.de/rss/ressort/Niedersachsen'),
(u'Vermischtes', u'http://www.noz.de/rss/ressort/Vermischtes'),
(u'GutzuWissen', u'http://www.noz.de/rss/ressort/Gut%20zu%20Wissen'),
(u'Sport', u'http://www.noz.de/rss/ressort/Sport'),
(u'Kultur', u'http://www.noz.de/rss/ressort/Kultur'),
(u'Medien', u'http://www.noz.de/rss/ressort/Medien'),
(u'Belm', u'http://www.noz.de/rss/ressort/Belm'),
(u'Bissendorf', u' [url]http://www.noz.de/rss/ressort/Bissendorf[/url]'),
(u'Osnabrueck', u'http://www.noz.de/rss/ressort/Osnabr%C3%BCck'),
(u'Bad Essen', u'http://www.noz.de/rss/ressort/Bad%20Essen'),
(u'Politik', u'http://www.noz.de/rss/ressort/Politik'),
(u'Wirtschaft', u'http://www.noz.de/rss/ressort/Wirtschaft'),
#(u'Fussball', u'http:/www.noz.de/rss/ressort/Fußball'),
#(u'VfL Osnabrueck', u'http://www.noz.de/rss/ressort/VfL%20Osnabr%C3%BCck'),
#(u'SF Lotte', u'http://www.noz.de/rss/ressort/SF%20Lotte'),
#(u'SV Meppen', u'http://www.noz.de/rss/ressort/SV%20Meppen'),
#(u'Artland Dragons', u'http://www.noz.de/rss/ressort/Artland%20Dragons'),
#(u'Panthers', u'http://www.noz.de/rss/ressort/Panthers'),
(u'OS-Sport', u'http://www.noz.de/rss/ressort/OS-Sport'),
#(u'Emsland Sport', u'http://www.noz.de/rss/ressort/EL-Sport'),
#(u'Lingen', u'http://www.noz.de/rss/ressort/Lingen'),
#(u'Lohne', u'http://www.noz.de/rss/ressort/Lohne'),
#(u'Emsbueren', u'http://www.noz.de/rss/ressort/Emsb%C3%BCren'),
#(u'Salzbergen', u'http://www.noz.de/rss/ressort/Salzbergen'),
#(u'Spelle', u'http://www.noz.de/rss/ressort/Spelle'),
#(u'Freren', u'http://www.noz.de/rss/ressort/Freren'),
#(u'Lengerich', u'http://www.noz.de/rss/ressort/Lengerich'),
#(u'Bad Iburg', u'http://www.noz.de/rss/ressort/Bad%20Iburg'),
#(u'Bad Laer', u'http://www.noz.de/rss/ressort/Bad%20Laer'),
#(u'Bad Rothenfelde', u'http://www.noz.de/rss/ressort/Bad%20Rothenfelde'),
#(u'GMHütte', u'http://www.noz.de/rss/ressort/Georgsmarienh%C3%BCtte'),
#(u'Glandorf', u'http://www.noz.de/rss/ressort/Glandorf'),
#(u'Hagen', u'http://www.noz.de/rss/ressort/Hagen'),
#(u'Hasbergen', u'http://www.noz.de/rss/ressort/Hasbergen'),
#(u'Hilter', u'http://www.noz.de/rss/ressort/Hilter'),
#(u'Lotte', u'http://www.noz.de/rss/ressort/Lotte'),
#(u'Wallenhorst', u'http://www.noz.de/rss/ressort/Wallenhorst'),
#(u'Westerkappeln', u'http://www.noz.de/rss/ressort/Westerkappeln'),
#(u'Artland', u'http://www.noz.de/rss/ressort/Artland'),
#(u'Bersenbrück', u'http://www.noz.de/rss/ressort/Bersenbr%C3%BCck'),
#(u'Fürstenau', u'http://www.noz.de/rss/ressort/F%C3%BCrstenau'),
#(u'Neuenkirchen', u'http://www.noz.de/rss/ressort/Neuenkirchen'),
#(u'Lokalsport', u'http://www.noz.de/rss/ressort/Lokalsport%20Nordkreis'),
#(u'Bramsche', u'http://www.noz.de/rss/ressort/Bramsche'),
#(u'Bramsche Ortsteile', u'http://www.noz.de/rss/ressort/Bramscher%20Ortsteile'),
#(u'Neuenkirchen Vörden', u'http://www.noz.de/rss/ressort/Neuenkirchen-V%C3%B6rden'),
#(u'Papenburg', u'http://www.noz.de/rss/ressort/Papenburg'),
#(u'Dörpen', u'http://www.noz.de/rss/ressort/D%C3%B6rpen'),
#(u'Rhede', u'http://www.noz.de/rss/ressort/Rhede'),
#(u'Lathen', u'http://www.noz.de/rss/ressort/Lathen'),
#(u'Sögel', u'http://www.noz.de/rss/ressort/S%C3%B6gel'),
#(u'Nordhümmling', u'http://www.noz.de/rss/ressort/Nordh%C3%BCmmling'),
#(u'Werlte', u'http://www.noz.de/rss/ressort/Werlte'),
#(u'Westoverledingen', u'http://www.noz.de/rss/ressort/Westoverledingen'),
#(u'Geeste', u'http://www.noz.de/rss/ressort/Geeste'),
#(u'Haren', u'http://www.noz.de/rss/ressort/Haren'),
#(u'Haselünne', u'http://www.noz.de/rss/ressort/Hasel%C3%BCnne'),
#(u'Herzlake', u'http://www.noz.de/rss/ressort/Herzlake'),
#(u'Meppen', u'http://www.noz.de/rss/ressort/Meppen'),
#(u'Twist', u'http://www.noz.de/rss/ressort/Twist'),
#(u'Bohmte', u'http://www.noz.de/rss/ressort/Bohmte'),
#(u'Ostercappeln', u'http://www.noz.de/rss/ressort/Ostercappeln')
]