#!/usr/bin/env python __license__ = 'GPL v3' __author__ = 'Gabriele Marini, based on Darko Miletic' __copyright__ = '2009, Darko Miletic ' description = 'Italian daily newspaper - v1.01 (04, January 2010)' ''' http://www.messaggero.it/ ''' import time from calibre.web.feeds.news import BasicNewsRecipe class IlMessaggero(BasicNewsRecipe): __author__ = 'Gabriele Marini' description = 'Italian News' # cover_url = 'http://www.ilmessaggero.it/img_tst/logomsgr.gif' title = u'Il Messaggero' publisher = 'Caltagirone Editore' category = 'News, politics, culture, economy, general interest' language = 'it' timefmt = '[%a, %d %b, %Y]' oldest_article = 5 max_articles_per_feed = 100 use_embedded_content = False recursion = 10 remove_javascript = True extra_css = ' .bianco31lucida{color: black} ' keep_only_tags = [dict(name='h1', attrs={'class': ['titoloLettura2', 'titoloart', 'bianco31lucida']}), dict(name='h2', attrs={ 'class': ['sottotitLettura', 'grigio16']}), dict(name='span', attrs={'class': 'testoArticoloG'}), dict(name='div', attrs={'id': 'testodim'}) ] def get_cover_url(self): cover = None st = time.localtime() year = str(st.tm_year) month = "%.2d" % st.tm_mon day = "%.2d" % st.tm_mday cover = 'http://carta.ilmessaggero.it/' + year + \ month + day + '/jpeg/MSGR_20_CITTA_1.jpg' br = BasicNewsRecipe.get_browser(self) try: br.open(cover) except: self.log("\nCover unavailable") cover = 'http://www.ilmessaggero.it/img_tst/logomsgr.gif' return cover feeds = [ (u'HomePage', u'http://www.ilmessaggero.it/rss/home.xml'), (u'Primo Piano', u'http://www.ilmessaggero.it/rss/initalia_primopiano.xml'), (u'Economia e Finanza', u'http://www.ilmessaggero.it/rss/economia.xml'), (u'Politica', u'http://www.ilmessaggero.it/rss/initalia_politica.xml'), (u'Cultura', u'http://www.ilmessaggero.it/rss/cultura.xml'), (u'Tecnologia', u'http://www.ilmessaggero.it/rss/tecnologia.xml'), (u'Spettacoli', u'http://www.ilmessaggero.it/rss/spettacoli.xml'), (u'Edizioni Locali', u'http://www.ilmessaggero.it/rss/edlocali.xml'), (u'Roma', u'http://www.ilmessaggero.it/rss/roma.xml'), (u'Benessere', u'http://www.ilmessaggero.it/rss/benessere.xml'), (u'Sport', u'http://www.ilmessaggero.it/rss/sport.xml'), (u'Moda', u'http://www.ilmessaggero.it/rss/moda.xml') ]