calibre/recipes/saechsische.recipe
2020-08-22 18:48:32 +05:30

77 lines
2.9 KiB
Python

#!/usr/bin/env python
##
# Written: March 2020
# Version: 1.0
# Last update: 2020-03-27
##
from __future__ import unicode_literals, division, absolute_import, print_function
'''
Fetch RSS-Feeds from saechsische.de
'''
from calibre.web.feeds.news import BasicNewsRecipe
def classes(classes):
q = frozenset(classes.split(' '))
return dict(
attrs={'class': lambda x: x and frozenset(x.split()).intersection(q)}
)
class Saechsische(BasicNewsRecipe):
title = 'Saechsische Zeitung'
__author__ = 'epubli'
description = 'RSS-Feeds von saechsische.de'
publisher = 'SZ'
publication_type = 'newspaper'
language = 'de'
encoding = 'UTF-8'
oldest_article = 1
max_articles_per_feed = 40
no_stylesheets = True
remove_javascript = True
remove_empty_feeds = True
scale_news_images_to_device = True
ignore_duplicate_articles = {'title', 'url'}
cover_url = 'https://www.saechsische.de/img/logo.svg'
feeds = [
('Dresden', 'feed://www.saechsische.de/rss/dresden'),
('Sachsen', 'feed://saechsische.de/rss/sachsen'),
('Dynamo', 'feed://www.saechsische.de/rss/dynamo'),
('Politik', 'feed://www.saechsische.de/rss/politik'),
('Wirtschaft', 'feed://www.saechsische.de/rss/wirtschaft'),
('Feuilleton', 'feed://www.saechsische.de/rss/feuilleton'),
('Sport', 'feed://www.saechsische.de/rss/sport'),
('Deutschland und Welt', 'feed://www.saechsische.de/rss/deutschland-welt'),
# ('Bautzen', 'feed://www.saechsische.de/rss/bautzen'),
# ('Bischofswerda', 'feed://www.saechsische.de/rss/bischofswerda'),
# ('Dippoldiswalde', 'feed://www.saechsische.de/rss/dippoldiswalde'),
# ('Döbeln', 'feed://www.saechsische.de/rss/doebeln'),
# ('Freital', 'feed://www.saechsische.de/rss/freital'),
# ('Großenhain', 'feed://www.saechsische.de/rss/grossenhain'),
# ('Görlitz', 'feed://www.saechsische.de/rss/goerlitz'),
# ('Kamenz', 'feed://www.saechsische.de/rss/kamenz'),
# ('Löbau', 'feed://www.saechsische.de/rss/loebau'),
# ('Meißen', 'feed://www.saechsische.de/rss/meissen'),
# ('Niesky', 'feed://www.saechsische.de/rss/niesky'),
# ('Pirna', 'feed://www.saechsische.de/rss/pirna'),
# ('Radeberg', 'feed://www.saechsische.de/rss/radeberg'),
# ('Radebeul', 'feed://www.saechsische.de/rss/radebeul'),
# ('Riesa', 'feed://www.saechsische.de/rss/riesa'),
# ('Sebnitz', 'feed://www.saechsische.de/rss/sebnitz'),
# ('Zittau', 'feed://www.saechsische.de/rss/zittau'),
]
keep_only_tags = [
dict(name='article', attrs={'class': 'article-detail'}),
]
remove_tags = [
classes('article-fill'),
dict(name='div', attrs={'class': 'article-related-container'}),
dict(name='div', attrs={'id': 'article-header'}),
dict(name='span', attrs={'class': 'article-plus'}),
]