fix konflikty_zbrojne recipe

This commit is contained in:
Tomasz Długosz 2015-10-20 10:28:12 +02:00 committed by Tomasz Długosz
parent 7b3bcbcbfa
commit 76be20f169

View File

@ -5,29 +5,21 @@ from calibre.ebooks.BeautifulSoup import BeautifulSoup
class Konflikty(BasicNewsRecipe):
title = u'Konflikty Zbrojne'
__author__ = 'fenuks'
cover_url = 'http://www.konflikty.pl/images/tapety_logo.jpg'
cover_url = 'http://konflikty.pl/wp-content/uploads/2014/07/konflikty.pl-logo.png'
language = 'pl'
description = u'Zbiór ciekawych artykułów historycznych, militarnych oraz recenzji książek, gier i filmów. Najświeższe informacje o lotnictwie, wojskach lądowych i polityce.'
category='military, history'
oldest_article = 7
max_articles_per_feed = 100
no_stylesheets = True
keep_only_tags=[dict(attrs={'class':['title1', 'image']}), dict(id='body')]
keep_only_tags=[
dict(name='h1'),
dict(name='div', attrs={'id': 'page-content'})]
feeds = [(u'Aktualności', u'http://www.konflikty.pl/rss_aktualnosci_10.xml'),
(u'Historia', u'http://www.konflikty.pl/rss_historia_10.xml'),
(u'Militaria', u'http://www.konflikty.pl/rss_militaria_10.xml'),
(u'Relacje', u'http://www.konflikty.pl/rss_relacje_10.xml'),
(u'Recenzje', u'http://www.konflikty.pl/rss_recenzje_10.xml'),
(u'Teksty źródłowe', u'http://www.konflikty.pl/rss_tekstyzrodlowe_10.xml')]
remove_tags = [dict(name='aside'),dict(name='p', attrs={'id': 'breadcrumbs'}),dict(name='div', attrs={'class':['tags clearfix','post-tags clearfix','post-nav section-container clearfix','about-author section-container clearfix vcard','post-related section-container clearfix',]}),dict(name='div',attrs={'id':'disqus_thread'})]
def preprocess_html(self, soup):
for item in soup.findAll(style=True):
del item['style']
for image in soup.findAll(name='a', attrs={'class':'image'}):
image['style'] = 'width: 210px; float: left; margin-right:5px;'
if image.img and image.img.has_key('alt'):
image.name='div'
pos = len(image.contents)
image.insert(pos, BeautifulSoup('<p style="font-style:italic;">'+image.img['alt']+'</p>'))
return soup
feeds = [(u'Konflikty Zbrojne', u'http://www.konflikty.pl/feed')]
extra_css = '''
h1 { font-size:130% }
'''