Nieuws.be and knack.be by erkfuizfeuadjfjzefzfuzeff

This commit is contained in:
Kovid Goyal 2017-02-19 19:49:20 +05:30
parent acd0d3879a
commit 70001df168
2 changed files with 98 additions and 0 deletions

39
recipes/knack_be.recipe Normal file
View File

@ -0,0 +1,39 @@
#!/usr/bin/env python2
from calibre.web.feeds.news import BasicNewsRecipe
class KnackBE(BasicNewsRecipe):
title = u'Knack.be'
__author__ = u'erkfuizfeuadjfjzefzfuzeff'
description = u'News from Belgium in Dutch'
oldest_article = 7
language = 'nl_BE'
max_articles_per_feed = 100
no_stylesheets = True
use_embedded_content = False
keep_only_tags = [
dict(name='title'), dict(name='h1', attrs={'itemprop': 'name'}),
dict(name='figure', attrs={'class': 'image'}),
dict(name='p', attrs={'class': 'lead'}),
dict(name='div', attrs={'class': 'article-body span8'})
]
remove_tags = [
dict(name='div', attrs={'class': 'Paywall'}),
dict(name='div', attrs={'class': 'teaser header-opinion'})
]
feeds = [(u'Nieuws', u'http://www.knack.be/nieuws/feed.rss'),
(u'België', u'http://www.knack.be/nieuws/belgie/feed.rss'),
(u'Wetenschap', u'http://www.knack.be/nieuws/wetenschap/feed.rss'),
(u'Planet Earth', u'http://www.knack.be/nieuws/planet-earth/feed.rss'),
(u'Mensen', u'http://www.knack.be/nieuws/mensen/feed.rss'),
(u'Boeken', u'http://www.knack.be/nieuws/boeken/feed.rss'),
(u'Opinie', u'http://www.knack.be/nieuws/opinie/feed.rss'),
(u'Wereld', u'http://www.knack.be/nieuws/wereld/feed.rss'),
(u'Gezondheid', u'http://www.knack.be/nieuws/gezondheid/feed.rss'),
(u'Auto', u'http://www.knack.be/nieuws/auto/feed.rss'),
(u'Ondertussen', u'http://www.knack.be/nieuws/ondertussen/feed.rss')]

59
recipes/nieuws_be.recipe Normal file
View File

@ -0,0 +1,59 @@
#!/usr/bin/env python2
from calibre.web.feeds.news import BasicNewsRecipe
class NieuwsBE(BasicNewsRecipe):
title = u'Nieuws.be'
__author__ = u'erkfuizfeuadjfjzefzfuzeff'
description = u'News from Belgium in Dutch'
oldest_article = 7
language = 'nl_BE'
max_articles_per_feed = 100
no_stylesheets = True
use_embedded_content = False
keep_only_tags = [
dict(name='title'), dict(name='h2'),
dict(name='div', attrs={'class': 'ArticleDiv'})
]
remove_tags = []
feeds = [
(u'Binnenland', u'http://www.nieuws.be/rss/nieuws/binnenland.rss'),
(u'Regio Algemeen', u'http://www.nieuws.be/rss/nieuws/regio.rss'),
(u'Buitenland', u'http://www.nieuws.be/rss/nieuws/buitenland.rss'),
(u'Sport', u'http://www.nieuws.be/rss/nieuws/sport.rss'),
(u'Fun and Famous', u'http://www.nieuws.be/rss/nieuws/fun_en_famous.rss'),
(u'Politiek', u'http://www.nieuws.be/rss/nieuws/politiek.rss'),
(u'Economie', u'http://www.nieuws.be/rss/nieuws/economie.rss'), (
u'Verkeer en Vervoer',
u'http://www.nieuws.be/rss/nieuws/verkeer_en_vervoer.rss'
), (u'Wetenschap', u'http://www.nieuws.be/rss/nieuws/wetenschap.rss'), (
u'Kunst en Cultuur',
u'http://www.nieuws.be/rss/nieuws/kunst_en_cultuur.rss'
), (u'I-Catchers', u'http://www.nieuws.be/rss/nieuws/i-catchers.rss'), (
u'Gezondheid & Lifestyle',
u'http://www.nieuws.be/rss/nieuws/gezondheid_en_lifestyle.rss'
), (u'Blogs', u'http://www.nieuws.be/rss/nieuws/blogs.rss'), (
u'Regio Antwerpen',
u'http://www.nieuws.be/rss/nieuws/antwerpen_(provincie).rss'
),
(u'Regio Limburg', u'http://www.nieuws.be/rss/nieuws/limburg_(Belgie).rss'),
(
u'Regio Oost-Vlaanderen',
u'http://www.nieuws.be/rss/nieuws/oost-vlaanderen.rss'
), (
u'Regio West-Vlaanderen',
u'http://www.nieuws.be/rss/nieuws/west-vlaanderen.rss'
), (
u'Regio Vlaams-Brabant',
u'http://www.nieuws.be/rss/nieuws/vlaams-brabant.rss'
), (
u'Regio Brussel',
u'http://www.nieuws.be/rss/nieuws/Brussel_(Groot-Brussel).rss'
), (u'Wallonië', u'http://www.nieuws.be/rss/nieuws/Wallonie.rss'),
(u'Snelnieuws', u'http://www.nieuws.be/rss/nieuws/snelnieuws.rss')
]