From fd2adb03ef85d39b0e089f36f85bc698bd09f3c9 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Tomasz=20D=C5=82ugosz?= Date: Sat, 17 Oct 2015 22:16:37 +0200 Subject: [PATCH] remove some garbage tags --- recipes/ciekawostki_historyczne.recipe | 5 ++--- 1 file changed, 2 insertions(+), 3 deletions(-) diff --git a/recipes/ciekawostki_historyczne.recipe b/recipes/ciekawostki_historyczne.recipe index 42ea94fa1d..fe04db98fa 100644 --- a/recipes/ciekawostki_historyczne.recipe +++ b/recipes/ciekawostki_historyczne.recipe @@ -4,7 +4,7 @@ import re class Ciekawostki_Historyczne(BasicNewsRecipe): title = u'Ciekawostki Historyczne' oldest_article = 7 - __author__ = 'fenuks' + __author__ = u'fenuks & Tomasz Długosz' description = u'Serwis popularnonaukowy - odkrycia, kontrowersje, historia, ciekawostki, badania, ciekawostki z przeszłości.' category = 'history' language = 'pl' @@ -18,7 +18,7 @@ class Ciekawostki_Historyczne(BasicNewsRecipe): remove_empty_feeds = True keep_only_tags = [dict(name='div', attrs={'class':'post'})] recursions = 5 - remove_tags = [dict(id='singlepostinfo')] + remove_tags = [dict(id='singlepostinfo'), dict(attrs={'class':['books short floatRight','unprintable','booksTable','bawmrp']})] feeds = [(u'Staro\u017cytno\u015b\u0107', u'http://ciekawostkihistoryczne.pl/tag/starozytnosc/feed/'), (u'\u015aredniowiecze', u'http://ciekawostkihistoryczne.pl/tag/sredniowiecze/feed/'), (u'Nowo\u017cytno\u015b\u0107', u'http://ciekawostkihistoryczne.pl/tag/nowozytnosc/feed/'), (u'XIX wiek', u'http://ciekawostkihistoryczne.pl/tag/xix-wiek/feed/'), (u'1914-1939', u'http://ciekawostkihistoryczne.pl/tag/1914-1939/feed/'), (u'1939-1945', u'http://ciekawostkihistoryczne.pl/tag/1939-1945/feed/'), (u'Powojnie (od 1945)', u'http://ciekawostkihistoryczne.pl/tag/powojnie/feed/'), (u'Recenzje', u'http://ciekawostkihistoryczne.pl/category/recenzje/feed/')] @@ -35,4 +35,3 @@ class Ciekawostki_Historyczne(BasicNewsRecipe): soup.find('h6').nextSibling.extract() return soup -