Update Cumhuriyet Yazarlar

This commit is contained in:
Kovid Goyal 2014-02-10 20:43:20 +05:30
parent 654cdf65a6
commit e820134e08

View File

@ -9,6 +9,9 @@ from __future__ import unicode_literals
# günlük köşe yazılarını hızlıca derleyip e-okuyucunuzda kolayca okunabilir
# hale getirir. Yazıların yayınlanma saati sabah olduğu için reçeteyi
# 7:00-24:00 arasında çizelgelemeniz gerekmektedir.
#
# 2014-02-10: Yenilenmiş Cumhuriyet Gazetesi web sitesine göre değiştirildi.
# 2013-08-28: İlk sürüm
__license__ = 'GPL v3'
__copyright__ = '2012, Sethi Eksi <sethi.eksi at gmail.com>'
@ -27,13 +30,18 @@ class Cumhuriyet_tr(BasicNewsRecipe):
oldest_article = 1
max_articles_per_feed = 150
no_stylesheets = True
encoding = 'cp1254'
encoding = 'utf-8'
use_embedded_content = False
masthead_url = 'http://www.cumhuriyet.com.tr/home/cumhuriyet/sablon2000/img/cumlogobeyaz1.gif'
masthead_url = 'http://www.cumhuriyet.com.tr/image/template/Cumhuriyet_logo_300x60px.png'
cover_url = 'http://www.cumhuriyet.com.tr/image/template/Cumhuriyet_logo_300x60px.png'
language = 'tr'
extra_css = """ @font-face {font-family: "sans1";src:url(res:///opt/sony/ebook/FONT/tt0003m_.ttf)}
.article_description,body{font-family: Arial,Verdana,Helvetica,sans1,sans-serif}
extra_css = """ .name {display: block;width:100%;font-size:120%;}
#article-title {display: block;margin-top: 15px;width:100%;font-size:140%;}
#publish-date {display: block;width:100%;font-size:80%;}
"""
# extra_css = """ @font-face {font-family: "sans1";src:url(res:///opt/sony/ebook/FONT/tt0003m_.ttf)}
# .article_description,body{font-family: Arial,Verdana,Helvetica,sans1,sans-serif}
# """
conversion_options = {
'comment' : description
@ -42,17 +50,21 @@ class Cumhuriyet_tr(BasicNewsRecipe):
, 'language' : language
}
remove_tags = [dict(name=['embed','iframe','object','link','base'])]
remove_tags_before = dict(attrs={'class':'c565'})
remove_tags_after = dict(attrs={'class':'c565'})
remove_tags = [dict(attrs={'class':'links'}),dict(attrs={'id':'share-bar'}),dict(attrs={'id':'font-adjust'})]
remove_tags_before = dict(attrs={'id':'content'})
remove_tags_after = dict(attrs={'id':'content'})
feeds = [
(u'Yazarlar' , u'http://www.cumhuriyet.com.tr/?kn=5&xl=rss')
(u'Yazarlar' , u'http://www.cumhuriyet.com.tr/rss/2')
]
def print_version(self, url):
articleid = url.rpartition('hn=')[2]
return 'http://www.cumhuriyet.com.tr/?hn=' + articleid
# def print_version(self, url):
# articleid = url.rpartition('hn=')[2]
# return 'http://www.cumhuriyet.com.tr/?hn=' + articleid
def get_masthead_title(self):
return self.title + "(" + self.end_date + ")"
def preprocess_html(self, soup):
return self.adeify_images(soup)