recipes: fix errors and styles

2025-07-09 03:04:10 -04:00 · 2010-12-08 23:43:54 +09:00 · 2010-12-08 23:43:54 +09:00 · 4e4c2b7e68
commit 4e4c2b7e68
parent 4d7bab28b6
2 changed files with 27 additions and 19 deletions
--- a/resources/recipes/the_h.recipe
+++ b/resources/recipes/the_h.recipe
@ -14,7 +14,7 @@ class TheHeiseOnline(BasicNewsRecipe):
    oldest_article = 3
    description    = 'In association with Heise Online'
    publisher      = 'Heise Media UK Ltd.'
-    category       = 'news, technology, security'
+    category       = 'news, technology, security, OSS, internet'
    max_articles_per_feed = 100
    language       = 'en'
    encoding       = 'utf-8'
@ -27,6 +27,12 @@ class TheHeiseOnline(BasicNewsRecipe):
    feeds          = [
                      (u'The H News Feed', u'http://www.h-online.com/news/atom.xml')
                     ]
    cover_url = 'http://www.h-online.com/icons/logo_theH.gif'
    remove_tags = [
                        dict(id="logo"),
                        dict(id="footer")
                        ]
    def print_version(self, url):
        return url + '?view=print'
--- a/resources/recipes/toyokeizai.recipe
+++ b/resources/recipes/toyokeizai.recipe
@ -17,17 +17,27 @@ class Toyokeizai(BasicNewsRecipe):
    category       = 'economy, magazine, japan'
    language       = 'ja'
    encoding       = 'euc-jp'
-    index          = 'http://www.toyokeizai.net/news/'
+    index          = 'http://member.toyokeizai.net/news/'
    remove_javascript = True
-    no_stylesheet = True
+    no_stylesheets = True
    masthead_title = u'TOYOKEIZAI'
    needs_subscription = True
    timefmt = '[%y/%m/%d]'
    recursions = 5
    match_regexps =[ r'page/\d+']
-    keep_only_tags = [dict(name='div', attrs={'class':['news']}),
+    keep_only_tags = [
-                      dict(name='div', attrs={'class':["news_con"]})
+                      dict(name='div', attrs={'class':['news']}),
                      dict(name='div', attrs={'class':["news_cont"]}),
                      dict(name='div', attrs={'class':["news_con"]}),
 #                      dict(name='div', attrs={'class':["norightsMessage"]})
                     ]
    remove_tags = [{'class':"mt35 mgz"},
                            {'class':"mt20 newzia"},
                            {'class':"mt20 fontS"},
                            {'class':"bk_btn_m"},
                            dict(id='newzia_connect_member')
                            ]
    remove_tags = [{'class':"mt35 mgz"}]
    def parse_index(self):
        feeds = []
@ -41,9 +51,8 @@ class Toyokeizai(BasicNewsRecipe):
                newsarticles.append({
                                      'title'      :itema.string
                                     ,'date'       :re.compile(r"\- ").sub("",itemd.string)
-                                     ,'url'        :'http://www.toyokeizai.net' + itema['href']
+                                     ,'url'        :'http://member.toyokeizai.net' + itema['href']
-                                    # ,'description':itema['title']
+                                     ,'description':itema['title']
                                    ,'description':''
                                    })
            feeds.append(('news', newsarticles))
        return feeds
@ -57,10 +66,3 @@ class Toyokeizai(BasicNewsRecipe):
            br['password'] = self.password
            res = br.submit()
        return br
    def is_link_wanted(url,tag):
        if  re.compile(r'page//[0-9]+//$').search(url):
            return True
        return False