From da20ff650287e0aebe416988b26f7cf906ec6b9a Mon Sep 17 00:00:00 2001 From: Kovid Goyal Date: Wed, 23 Mar 2011 13:16:52 -0600 Subject: [PATCH] Improve 168 ora --- recipes/h1.recipe | 68 ++++++++++++++++++++++++++++------------------- 1 file changed, 40 insertions(+), 28 deletions(-) diff --git a/recipes/h1.recipe b/recipes/h1.recipe index 981770092f..28d7077137 100644 --- a/recipes/h1.recipe +++ b/recipes/h1.recipe @@ -1,33 +1,45 @@ -#!/usr/bin/env python -# vim:fileencoding=UTF-8:ts=4:sw=4:sta:et:sts=4:ai -from __future__ import with_statement +# -*- coding: utf-8 -*- +import re +from calibre.web.feeds.recipes import BasicNewsRecipe -__license__ = 'GPL v3' -__copyright__ = '2009, Kovid Goyal ' -__docformat__ = 'restructuredtext en' +class hu168ora(BasicNewsRecipe): + title = u'168 óra' + __author__ = u'István Papp' + description = u'A 168 óra friss hírei' + timefmt = ' [%Y. %b. %d., %a.]' + oldest_article = 7 + language = 'hu' -from calibre.web.feeds.news import BasicNewsRecipe - -class H168(BasicNewsRecipe): - title = u'168\xf3ra' - oldest_article = 4 - max_articles_per_feed = 50 - language = 'hu' - - __author__ = 'Ezmegaz' - - feeds = [(u'Itthon', - u'http://www.168ora.hu/static/rss/cikkek_itthon.xml'), (u'Gl\xf3busz', - u'http://www.168ora.hu/static/rss/cikkek_globusz.xml'), (u'Punch', - u'http://www.168ora.hu/static/rss/cikkek_punch.xml'), (u'Arte', - u'http://www.168ora.hu/static/rss/cikkek_arte.xml'), (u'Buxa', - u'http://www.168ora.hu/static/rss/cikkek_buxa.xml'), (u'Sebess\xe9g', - u'http://www.168ora.hu/static/rss/cikkek_sebesseg.xml'), (u'Tud\xe1s', - u'http://www.168ora.hu/static/rss/cikkek_tudas.xml'), (u'Sport', - u'http://www.168ora.hu/static/rss/cikkek_sport.xml'), (u'V\xe9lem\xe9ny', - u'http://www.168ora.hu/static/rss/cikkek_velemeny.xml'), (u'Dolce Vita', - u'http://www.168ora.hu/static/rss/cikkek_dolcevita.xml'), (u'R\xe1di\xf3', - u'http://www.168ora.hu/static/rss/radio.xml')] + max_articles_per_feed = 100 + no_stylesheets = True + use_embedded_content = False + encoding = 'utf8' + publisher = u'Telegráf Kiadó' + category = u'news, hírek, 168' + extra_css = 'body{ font-family: Verdana,Helvetica,Arial,sans-serif } .lead{font-weight: bold} h2{text-align: center; text-transform: uppercase} ' + preprocess_regexps = [(re.compile(r'', re.DOTALL), lambda m: '')] + remove_tags_before = dict(id='cikk_fejlec') + remove_tags_after = dict(id='szoveg') + remove_tags = [dict(id='box_toolbar')] + remove_javascript = True + remove_empty_feeds = True + feeds = [ + (u'Itthon', u'http://www.168ora.hu/static/rss/cikkek_itthon.xml') + ,(u'Glóbusz', u'http://www.168ora.hu/static/rss/cikkek_globusz.xml') + ,(u'Punch', u'http://www.168ora.hu/static/rss/cikkek_punch.xml') + ,(u'Arte', u'http://www.168ora.hu/static/rss/cikkek_arte.xml') + ,(u'Buxa', u'http://www.168ora.hu/static/rss/cikkek_buxa.xml') + ,(u'Sebesség', u'http://www.168ora.hu/static/rss/cikkek_sebesseg.xml') + ,(u'Tudás', u'http://www.168ora.hu/static/rss/cikkek_tudas.xml') + ,(u'Sport', u'http://www.168ora.hu/static/rss/cikkek_sport.xml') + ,(u'Vélemény', u'http://www.168ora.hu/static/rss/cikkek_velemeny.xml') + ,(u'Dolce Vita', u'http://www.168ora.hu/static/rss/cikkek_dolcevita.xml') + ,(u'Rádió', u'http://www.168ora.hu/static/rss/radio.xml') + ] + + def print_version(self, url): + url += '?print=1' + return url