Update Il Messaggero and Libero

This commit is contained in:
Kovid Goyal 2013-01-04 18:28:53 +05:30
parent 22ee6226ce
commit 8f41087b15
2 changed files with 19 additions and 15 deletions

View File

@ -28,12 +28,15 @@ class IlMessaggero(BasicNewsRecipe):
recursion = 10 recursion = 10
remove_javascript = True remove_javascript = True
extra_css = ' .bianco31lucida{color: black} '
keep_only_tags = [dict(name='h1', attrs={'class':['titoloLettura2','titoloart','bianco31lucida']}),
keep_only_tags = [dict(name='h1', attrs={'class':'titoloLettura2'}), dict(name='h2', attrs={'class':['sottotitLettura','grigio16']}),
dict(name='h2', attrs={'class':'sottotitLettura'}), dict(name='span', attrs={'class':'testoArticoloG'}),
dict(name='span', attrs={'class':'testoArticoloG'}) dict(name='div', attrs={'id':'testodim'})
] ]
def get_cover_url(self): def get_cover_url(self):
cover = None cover = None
st = time.localtime() st = time.localtime()
@ -55,17 +58,16 @@ class IlMessaggero(BasicNewsRecipe):
feeds = [ feeds = [
(u'HomePage', u'http://www.ilmessaggero.it/rss/home.xml'), (u'HomePage', u'http://www.ilmessaggero.it/rss/home.xml'),
(u'Primo Piano', u'http://www.ilmessaggero.it/rss/initalia_primopiano.xml'), (u'Primo Piano', u'http://www.ilmessaggero.it/rss/initalia_primopiano.xml'),
(u'Cronaca Bianca', u'http://www.ilmessaggero.it/rss/initalia_cronacabianca.xml'),
(u'Cronaca Nera', u'http://www.ilmessaggero.it/rss/initalia_cronacanera.xml'),
(u'Economia e Finanza', u'http://www.ilmessaggero.it/rss/economia.xml'), (u'Economia e Finanza', u'http://www.ilmessaggero.it/rss/economia.xml'),
(u'Politica', u'http://www.ilmessaggero.it/rss/initalia_politica.xml'), (u'Politica', u'http://www.ilmessaggero.it/rss/initalia_politica.xml'),
(u'Scienza e Tecnologia', u'http://www.ilmessaggero.it/rss/scienza.xml'), (u'Cultura', u'http://www.ilmessaggero.it/rss/cultura.xml'),
(u'Cinema', u'http://www.ilmessaggero.it/rss.php?refresh_ce#'), (u'Tecnologia', u'http://www.ilmessaggero.it/rss/tecnologia.xml'),
(u'Viaggi', u'http://www.ilmessaggero.it/rss.php?refresh_ce#'), (u'Spettacoli', u'http://www.ilmessaggero.it/rss/spettacoli.xml'),
(u'Edizioni Locali', u'http://www.ilmessaggero.it/rss/edlocali.xml'),
(u'Roma', u'http://www.ilmessaggero.it/rss/roma.xml'), (u'Roma', u'http://www.ilmessaggero.it/rss/roma.xml'),
(u'Cultura e Tendenze', u'http://www.ilmessaggero.it/rss/roma_culturaspet.xml'), (u'Benessere', u'http://www.ilmessaggero.it/rss/benessere.xml'),
(u'Sport', u'http://www.ilmessaggero.it/rss/sport.xml'), (u'Sport', u'http://www.ilmessaggero.it/rss/sport.xml'),
(u'Calcio', u'http://www.ilmessaggero.it/rss/sport_calcio.xml'), (u'Moda', u'http://www.ilmessaggero.it/rss/moda.xml')
(u'Motori', u'http://www.ilmessaggero.it/rss/sport_motori.xml')
] ]

View File

@ -14,7 +14,8 @@ class LiberoNews(BasicNewsRecipe):
__author__ = 'Marini Gabriele' __author__ = 'Marini Gabriele'
description = 'Italian daily newspaper' description = 'Italian daily newspaper'
cover_url = 'http://www.libero-news.it/images/logo.png' #cover_url = 'http://www.liberoquotidiano.it/images/Libero%20Quotidiano.jpg'
cover_url = 'http://www.edicola.liberoquotidiano.it/vnlibero/fpcut.jsp?testata=milano'
title = u'Libero ' title = u'Libero '
publisher = 'EDITORIALE LIBERO s.r.l 2006' publisher = 'EDITORIALE LIBERO s.r.l 2006'
category = 'News, politics, culture, economy, general interest' category = 'News, politics, culture, economy, general interest'
@ -32,10 +33,11 @@ class LiberoNews(BasicNewsRecipe):
remove_javascript = True remove_javascript = True
keep_only_tags = [ keep_only_tags = [
dict(name='div', attrs={'class':'Articolo'}) dict(name='div', attrs={'class':'Articolo'}),
dict(name='article')
] ]
remove_tags = [ remove_tags = [
dict(name='div', attrs={'class':['CommentaFoto','Priva2']}), dict(name='div', attrs={'class':['CommentaFoto','Priva2','login_commenti','box_16']}),
dict(name='div', attrs={'id':['commentigenerale']}) dict(name='div', attrs={'id':['commentigenerale']})
] ]
feeds = [ feeds = [