Improve 168 ora

This commit is contained in:
Kovid Goyal 2011-03-23 13:16:52 -06:00
parent 7384cc87e6
commit da20ff6502

View File

@ -1,33 +1,45 @@
#!/usr/bin/env python # -*- coding: utf-8 -*-
# vim:fileencoding=UTF-8:ts=4:sw=4:sta:et:sts=4:ai import re
from __future__ import with_statement from calibre.web.feeds.recipes import BasicNewsRecipe
__license__ = 'GPL v3' class hu168ora(BasicNewsRecipe):
__copyright__ = '2009, Kovid Goyal <kovid@kovidgoyal.net>' title = u'168 óra'
__docformat__ = 'restructuredtext en' __author__ = u'István Papp'
description = u'A 168 óra friss hírei'
from calibre.web.feeds.news import BasicNewsRecipe timefmt = ' [%Y. %b. %d., %a.]'
oldest_article = 7
class H168(BasicNewsRecipe):
title = u'168\xf3ra'
oldest_article = 4
max_articles_per_feed = 50
language = 'hu' language = 'hu'
__author__ = 'Ezmegaz' max_articles_per_feed = 100
no_stylesheets = True
feeds = [(u'Itthon', use_embedded_content = False
u'http://www.168ora.hu/static/rss/cikkek_itthon.xml'), (u'Gl\xf3busz', encoding = 'utf8'
u'http://www.168ora.hu/static/rss/cikkek_globusz.xml'), (u'Punch', publisher = u'Telegráf Kiadó'
u'http://www.168ora.hu/static/rss/cikkek_punch.xml'), (u'Arte', category = u'news, hírek, 168'
u'http://www.168ora.hu/static/rss/cikkek_arte.xml'), (u'Buxa', extra_css = 'body{ font-family: Verdana,Helvetica,Arial,sans-serif } .lead{font-weight: bold} h2{text-align: center; text-transform: uppercase} '
u'http://www.168ora.hu/static/rss/cikkek_buxa.xml'), (u'Sebess\xe9g', preprocess_regexps = [(re.compile(r'<!--.*?-->', re.DOTALL), lambda m: '')]
u'http://www.168ora.hu/static/rss/cikkek_sebesseg.xml'), (u'Tud\xe1s', remove_tags_before = dict(id='cikk_fejlec')
u'http://www.168ora.hu/static/rss/cikkek_tudas.xml'), (u'Sport', remove_tags_after = dict(id='szoveg')
u'http://www.168ora.hu/static/rss/cikkek_sport.xml'), (u'V\xe9lem\xe9ny', remove_tags = [dict(id='box_toolbar')]
u'http://www.168ora.hu/static/rss/cikkek_velemeny.xml'), (u'Dolce Vita', remove_javascript = True
u'http://www.168ora.hu/static/rss/cikkek_dolcevita.xml'), (u'R\xe1di\xf3', remove_empty_feeds = True
u'http://www.168ora.hu/static/rss/radio.xml')]
feeds = [
(u'Itthon', u'http://www.168ora.hu/static/rss/cikkek_itthon.xml')
,(u'Glóbusz', u'http://www.168ora.hu/static/rss/cikkek_globusz.xml')
,(u'Punch', u'http://www.168ora.hu/static/rss/cikkek_punch.xml')
,(u'Arte', u'http://www.168ora.hu/static/rss/cikkek_arte.xml')
,(u'Buxa', u'http://www.168ora.hu/static/rss/cikkek_buxa.xml')
,(u'Sebesség', u'http://www.168ora.hu/static/rss/cikkek_sebesseg.xml')
,(u'Tudás', u'http://www.168ora.hu/static/rss/cikkek_tudas.xml')
,(u'Sport', u'http://www.168ora.hu/static/rss/cikkek_sport.xml')
,(u'Vélemény', u'http://www.168ora.hu/static/rss/cikkek_velemeny.xml')
,(u'Dolce Vita', u'http://www.168ora.hu/static/rss/cikkek_dolcevita.xml')
,(u'Rádió', u'http://www.168ora.hu/static/rss/radio.xml')
]
def print_version(self, url):
url += '?print=1'
return url