From 0aecdc7e57c598f64351755b9fca0c6350081556 Mon Sep 17 00:00:00 2001 From: Kovid Goyal Date: Sat, 28 Mar 2020 09:01:54 +0530 Subject: [PATCH] Saechsische Zeitung by epubli --- recipes/saechsische.recipe | 76 ++++++++++++++++++++++++++++++++++++++ 1 file changed, 76 insertions(+) create mode 100644 recipes/saechsische.recipe diff --git a/recipes/saechsische.recipe b/recipes/saechsische.recipe new file mode 100644 index 0000000000..0fd7964ed0 --- /dev/null +++ b/recipes/saechsische.recipe @@ -0,0 +1,76 @@ +#!/usr/bin/env python2 +## +# Written: March 2020 +# Version: 1.0 +# Last update: 2020-03-27 +## +from __future__ import unicode_literals, division, absolute_import, print_function +''' +Fetch RSS-Feeds from saechsische.de +''' + +from calibre.web.feeds.news import BasicNewsRecipe + + +def classes(classes): + q = frozenset(classes.split(' ')) + return dict( + attrs={'class': lambda x: x and frozenset(x.split()).intersection(q)} + ) + + +class Saechsische(BasicNewsRecipe): + title = 'Saechsische Zeitung' + __author__ = 'epubli' + description = 'RSS-Feeds von saechsische.de' + publisher = 'SZ' + publication_type = 'newspaper' + language = 'de' + encoding = 'UTF-8' + oldest_article = 1 + max_articles_per_feed = 40 + no_stylesheets = True + remove_javascript = True + remove_empty_feeds = True + scale_news_images_to_device = True + ignore_duplicate_articles = {'title', 'url'} + cover_url = 'https://www.saechsische.de/img/logo.svg' + + feeds = [ + ('Dresden', 'feed://www.saechsische.de/rss/dresden'), + ('Sachsen', 'feed://saechsische.de/rss/sachsen'), + ('Dynamo', 'feed://www.saechsische.de/rss/dynamo'), + ('Politik', 'feed://www.saechsische.de/rss/politik'), + ('Wirtschaft', 'feed://www.saechsische.de/rss/wirtschaft'), + ('Feuilleton', 'feed://www.saechsische.de/rss/feuilleton'), + ('Sport', 'feed://www.saechsische.de/rss/sport'), + ('Deutschland und Welt', 'feed://www.saechsische.de/rss/deutschland-welt'), + # ('Bautzen', 'feed://www.saechsische.de/rss/bautzen'), + # ('Bischofswerda', 'feed://www.saechsische.de/rss/bischofswerda'), + # ('Dippoldiswalde', 'feed://www.saechsische.de/rss/dippoldiswalde'), + # ('Döbeln', 'feed://www.saechsische.de/rss/doebeln'), + # ('Freital', 'feed://www.saechsische.de/rss/freital'), + # ('Großenhain', 'feed://www.saechsische.de/rss/grossenhain'), + # ('Görlitz', 'feed://www.saechsische.de/rss/goerlitz'), + # ('Kamenz', 'feed://www.saechsische.de/rss/kamenz'), + # ('Löbau', 'feed://www.saechsische.de/rss/loebau'), + # ('Meißen', 'feed://www.saechsische.de/rss/meissen'), + # ('Niesky', 'feed://www.saechsische.de/rss/niesky'), + # ('Pirna', 'feed://www.saechsische.de/rss/pirna'), + # ('Radeberg', 'feed://www.saechsische.de/rss/radeberg'), + # ('Radebeul', 'feed://www.saechsische.de/rss/radebeul'), + # ('Riesa', 'feed://www.saechsische.de/rss/riesa'), + # ('Sebnitz', 'feed://www.saechsische.de/rss/sebnitz'), + # ('Zittau', 'feed://www.saechsische.de/rss/zittau'), + ] + + keep_only_tags = [ + dict(name='article', attrs={'class': 'article-detail'}), + ] + + remove_tags = [ + classes('article-fill'), + dict(name='div', attrs={'class': 'article-related-container'}), + dict(name='div', attrs={'id': 'article-header'}), + dict(name='span', attrs={'class': 'article-plus'}), + ]