pep8 and char encoding fixes for the new danish recipes

This commit is contained in:
Kovid Goyal 2016-09-29 21:24:14 +05:30
parent d360006d23
commit 3a65be0971
23 changed files with 58 additions and 51 deletions

View File

@ -10,9 +10,10 @@ Albertslund Posten
class AlbertslundLokalavisen_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Albertslund Posten'
description = 'RSS feed med sidste nyt fra Albertslund Posten. Der er nye historier flere gange dagligt - få de seneste nyheder fra dit lokalområde automatisk. Albertslund Posten. albertslund.lokalavisen.dk'
description = ('RSS feed med sidste nyt fra Albertslund Posten. Der er nye historier flere gange dagligt'
' - få de seneste nyheder fra dit lokalområde automatisk. Albertslund Posten. albertslund.lokalavisen.dk')
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
oldest_article = 7
max_articles_per_feed = 25
auto_cleanup = True
language = 'da'

View File

@ -10,7 +10,8 @@ Allerød Nyt: RSS feed: Seneste nyt - alleroed.lokalavisen.dk
class AlleroedLokalavisen_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Allerød Nyt - alleroed.lokalavisen.dk'
description = 'RSS feed med sidste nyt fra Allerød Nyt. Der er nye historier flere gange dagligt - få de seneste nyheder fra dit lokalområde automatisk. Allerød Nyt. alleroed.lokalavisen.dk'
description = ('RSS feed med sidste nyt fra Allerød Nyt. Der er nye historier flere gange dagligt'
' - få de seneste nyheder fra dit lokalområde automatisk. Allerød Nyt. alleroed.lokalavisen.dk')
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -10,13 +10,13 @@ Alt om DATA, Datatid TechLife - Download, test, antivirus, netværk
class WwwAltomdata_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Alt om DATA, Datatid TechLife - Download, test, antivirus, netværk'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50
language='da'
resolve_internal_links = True
remove_empty_feeds = True
language='da'
resolve_internal_links = True
remove_empty_feeds = True
auto_cleanup = True
language = 'da'

View File

@ -10,7 +10,7 @@ Amagerbladet
class Amagerbladet_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Amagerbladet'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -10,7 +10,8 @@ Avisen.dk
class WwwAvisen_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Avisen.dk'
description = 'Nyheder, artikler, seneste nyt, nyhedsarkiv, kommentarer og blogs. Avisen.dk dækker bredt, men har fokus på arbejdslivet. Avisen.dk - går arbejdet bedre'
description = ('Nyheder, artikler, seneste nyt, nyhedsarkiv, kommentarer og blogs. Avisen.dk dækker bredt,'
' men har fokus på arbejdslivet. Avisen.dk - går arbejdet bedre')
category = 'newspaper, news, Denmark'
oldest_article = 7
max_articles_per_feed = 50
@ -18,6 +19,6 @@ class WwwAvisen_dk(BasicNewsRecipe):
language = 'da'
feeds = [
('Nyheder fra Avisen.dk', 'http://www.avisen.dk/rss.aspx'),
('Nyheder fra Avisen.dk', 'http://www.avisen.dk/rss.aspx'),
]

View File

@ -10,7 +10,7 @@ City Avisen
class CityAvisen_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'City Avisen'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -10,7 +10,9 @@ Computerworld.dk
class WwwComputerworld_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Computerworld.dk'
description = 'Nyheder, analyser, viden, blogs og debat om it. Computerworld er dit medie om det digitale Danmark. Computerworld skriver om nye teknologier, hardware, software, informationssamfundet, internettet, it-branchen, telebranchen, it-ledelse, it-strategi, forretnings-it , it-job og meget mere.'
description = ('Nyheder, analyser, viden, blogs og debat om it. Computerworld er dit medie om det digitale Danmark.'
' Computerworld skriver om nye teknologier, hardware, software, informationssamfundet, internettet,'
' it-branchen, telebranchen, it-ledelse, it-strategi, forretnings-it , it-job og meget mere.')
category = 'technology, news, business, linux, opensource, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -39,4 +39,4 @@ class DRNyheder(BasicNewsRecipe):
('DR Trekantområdet', 'http://www.dr.dk/Nyheder/Service/feeds/regionale/trekanten/'),
('DR Sjælland', 'http://www.dr.dk/Nyheder/Service/feeds/regionale/sjaelland/'),
('DR Østjylland', 'http://www.dr.dk/Nyheder/Service/feeds/regionale/oestjylland/'),
]
]

View File

@ -10,7 +10,7 @@ Erhvervs•Avisen: RSS feed: Seneste nyt - erhvervsavisen.dk
class Erhvervsavisen_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Erhvervs Avisen'
description = 'Lokale, regionale nyheder, bolig, motor og job i Køge, Greve, Ringsted og Stevns på erhvervsavisen.dk'
description = 'Lokale, regionale nyheder, bolig, motor og job i Køge, Greve, Ringsted og Stevns på erhvervsavisen.dk'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -10,7 +10,7 @@ Frederiksberg Bladet
class FrederiksbergBladet_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Frederiksberg Bladet'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -4,13 +4,13 @@
from __future__ import unicode_literals, division, absolute_import, print_function
from calibre.web.feeds.news import BasicNewsRecipe
'''
Hillerød Posten
Hillerød Posten
'''
class HilleroedLokalavisen_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Hillerød Posten'
description = 'Lokale og regionale nyheder, sport og kultur fra Hillerød, Skævinge og Gørløse på hilleroed.lokalavisen.dk'
title = 'Hillerød Posten'
description = 'Lokale og regionale nyheder, sport og kultur fra Hillerød, Skævinge og Gørløse på hilleroed.lokalavisen.dk'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50
@ -18,11 +18,11 @@ class HilleroedLokalavisen_dk(BasicNewsRecipe):
language = 'da'
feeds = [
('Seneste nyt fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestenytrss'),
('Seneste lokale nyheder fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestelokalenyhederrss'),
('Seneste sport fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestesportrss'),
('Seneste 112 nyheder fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/seneste112rss'),
('Seneste kultur nyheder fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestekulturrss'),
('Seneste læserbreve fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestelaeserbreverss'),
('Seneste nyt fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestenytrss'),
('Seneste lokale nyheder fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestelokalenyhederrss'),
('Seneste sport fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestesportrss'),
('Seneste 112 nyheder fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/seneste112rss'),
('Seneste kultur nyheder fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestekulturrss'),
('Seneste læserbreve fra Hillerød Posten', 'http://hilleroed.lokalavisen.dk/section/senestelaeserbreverss'),
]
]

View File

@ -13,5 +13,5 @@ class Hvidovre_Avis_dk(BasicNewsRecipe):
('Sport', 'http://hvidovre.lokalavisen.dk/section/senestesportrss'),
('112', 'http://hvidovre.lokalavisen.dk/section/seneste112rss'),
('Kultur', 'http://hvidovre.lokalavisen.dk/section/senestekulturrss'),
('Læserbreve', 'http://hvidovre.lokalavisen.dk/section/senestelaeserbreverss'),
]
('Læserbreve', 'http://hvidovre.lokalavisen.dk/section/senestelaeserbreverss'),
]

View File

@ -5,6 +5,7 @@ __copyright__ = '2010, Darko Miletic <darko.miletic at gmail.com>'
information.dk
'''
import re
from calibre.web.feeds.news import BasicNewsRecipe
@ -43,7 +44,7 @@ class Information_dk(BasicNewsRecipe):
dict(name='div', attrs={'class': 'field-name-body'})]
remove_tags_before = dict(name='h1', attrs={'class': 'print-title'})
remove_tags_after = dict(name='div', attrs={'class': 'print-footer'})
field_name_best_from_inf = '^.*?field-name-best-from-inf.*?$'
related_stuff = '^.*?related-stuff.*?$'
view_iv_seneste = '^.*?view-iv-seneste.*?$'
@ -53,7 +54,7 @@ class Information_dk(BasicNewsRecipe):
field_name_comments_label = '^.*?field-name-comments-label.*?$'
field_name_no_comments = '^.?field-name-no-comments.*?$'
comment = '^.*?comment.*?$'
remove_tags = [dict(name=['object', 'link']),
dict(name='div', attrs={'id': 'node-article-full-group-date'}),
dict(name='div', attrs={'id': 'node-article-full-group-right'}),

View File

@ -4,34 +4,34 @@
from __future__ import unicode_literals, division, absolute_import, print_function
from calibre.web.feeds.news import BasicNewsRecipe
'''
Ingeniøren.dk
Ingeniøren.dk
'''
class Ing_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Ingeniøren'
title = 'Ingeniøren'
description = 'Nyheder om teknologi og naturvidenskab for fagfolk og interesserede; artikler, blogs, debat, infografik, video.'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50
auto_cleanup = True
keep_only_tags = [
dict(name="div", attrs={'class': 'menu-article-current-title'}),
dict(name="section", attrs={'class': 'byline'}),
dict(name="section", attrs={'class': 'body'}),
]
feeds = [
('Biotek', 'https://ing.dk/rss/term/341'),
('Byggeri', 'https://ing.dk/rss/term/356'),
('Elektronik', 'https://ing.dk/rss/term/355'),
('Energi og Miljø', 'https://ing.dk/rss/term/354'),
('Energi og Miljø', 'https://ing.dk/rss/term/354'),
('Forskning', 'https://ing.dk/rss/term/353'),
('Fødevare', 'https://ing.dk/rss/term/352'),
('Fødevare', 'https://ing.dk/rss/term/352'),
('Karriere', 'https://ing.dk/rss/term/350'),
('Produktion', 'https://ing.dk/rss/term/349'),
('Rumfart', 'https://ing.dk/rss/term/348'),
('Transport', 'https://ing.dk/rss/term/347'),
('Blogs', 'https://ing.dk/rss/blogs'),
('Spørg Scientariet', 'https://ing.dk/rss/term/287'),
('Spørg Scientariet', 'https://ing.dk/rss/term/287'),
]

View File

@ -14,7 +14,7 @@ class KristeligtDagblad(BasicNewsRecipe):
('Leder', 'http://www.kristeligt-dagblad.dk/rss/leder'),
('Danmark', 'http://www.kristeligt-dagblad.dk/rss/danmark'),
('Udland', 'http://www.kristeligt-dagblad.dk/rss/udland'),
('Liv & Sjæl', 'http://www.kristeligt-dagblad.dk/rss/liv'),
('Liv & Sjæl', 'http://www.kristeligt-dagblad.dk/rss/liv'),
('Familieliv', 'http://www.kristeligt-dagblad.dk/rss/familieliv'),
('Kronik', 'http://www.kristeligt-dagblad.dk/rss/kronik'),
('Kirke & Tro', 'http://www.kristeligt-dagblad.dk/rss/kirke'),
@ -22,4 +22,4 @@ class KristeligtDagblad(BasicNewsRecipe):
('Kultur', 'http://www.kristeligt-dagblad.dk/rss/kultur'),
('B\xf8ger', 'http://www.kristeligt-dagblad.dk/rss/boganmeldelse'),
('Film', 'http://www.kristeligt-dagblad.dk/rss/filmanmeldelse'),
]
]

View File

@ -7,7 +7,7 @@ from calibre.web.feeds.news import BasicNewsRecipe
Det grønne område
'''
class Lyngby-taarbaekLokalavisen_dk(BasicNewsRecipe):
class Lyngby_taarbaekLokalavisen_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Det grønne område'
description = 'Lokale, regionale nyheder, sport og kultur i Lyngby-Taarbæk, Virum, Holte, Nærum, Vedbæk og Skodsborg på lyngby-taarbaek.lokalavisen.dk'

View File

@ -10,7 +10,7 @@ Nørrebro Nordvest bladet
class Minby_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Nørrebro Nordvest bladet'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -10,7 +10,8 @@ Nordjyske.dk
class Nordjyske_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Nordjyske.dk'
description = 'Nordjyske.dk er hele tiden klar med de nyheder, der handler om dig og dit liv. Og du får dem lige der, hvor du er - på din computer, tablet eller mobiltelefon.'
description = ('Nordjyske.dk er hele tiden klar med de nyheder, der handler om dig og dit liv.'
' Og du får dem lige der, hvor du er - på din computer, tablet eller mobiltelefon.')
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 25

View File

@ -10,7 +10,7 @@ from calibre.web.feeds.news import BasicNewsRecipe
class OesterbroAvis_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Østerbro Avis'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -10,7 +10,7 @@ Valby Bladet
class ValbyBladet_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Valby Bladet'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -10,7 +10,7 @@ Vanløse Bladet
class VanloeseBladet_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Vanløse Bladet'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50

View File

@ -22,21 +22,21 @@ class version2(BasicNewsRecipe):
use_embedded_content = False
encoding = 'utf-8'
language = 'da'
extra_css = '.article { font-weight: normal; }'
preprocess_regexps = [(re.compile(r'</?a[^>]*>'), lambda match: ''),
(re.compile(r'<span[^>]*article-link-id.*?<br\s*\/?><br\s*\/?>'), lambda match: '')]
keep_only_tags = [dict(name='div', attrs={'id': 'article-page'}),
dict(name='section', attrs={'class': 'byline'}),
dict(name='section', attrs={'class': 'body'})]
dict(name='section', attrs={'class': 'byline'}),
dict(name='section', attrs={'class': 'body'})]
remove_tags = [
dict(name='p', attrs={'class': 'meta links'}),
dict(name='div', attrs={'class': 'float-right'}),
dict(name='span', attrs={'class': 'article-link-id'}),
dict(name='section', attrs={'class': 'social-tools-pane'}),
dict(name='section', attrs={'class': 'social-tools-pane'}),
dict(name='section', attrs={'class': 'article-timeline'}),
dict(name='div', attrs={'id' : 'mini-panel-comments_and_form'}),
dict(name='div', attrs={'class': 'related-articles top-three'}),
@ -60,5 +60,5 @@ class version2(BasicNewsRecipe):
feeds = [
(u'Seneste nyheder', u'https://www.version2.dk/it-nyheder/rss'),
(u'Seneste blogs', u'https://www.version2.dk/blogs/rss'),
(u'Seneste kommentarer', u'https://www.version2.dk/debat/rss')
(u'Seneste kommentarer', u'https://www.version2.dk/debat/rss')
]

View File

@ -10,7 +10,7 @@ Vesterbro Bladet
class VesterbroBladet_dk(BasicNewsRecipe):
__author__ = 'CoderAllan.github.com'
title = 'Vesterbro Bladet'
category = 'newspaper, news, localnews, sport, culture, Denmark'
oldest_article = 7
max_articles_per_feed = 50