Merge branch 'master' of https://github.com/unkn0w7n/calibre

2025-08-11 09:13:57 -04:00 · 2024-03-10 09:55:32 +05:30 · 2024-03-10 09:55:32 +05:30 · 2aec8675cd
commit 2aec8675cd
parent e9fa788d8f 4559d2cda7
3 changed files with 45 additions and 36 deletions
--- a/recipes/natgeo.recipe
+++ b/recipes/natgeo.recipe
@ -19,8 +19,10 @@ def classes(classes):
 def extract_json(raw):
    s = raw.find("window['__natgeo__']")
    script = raw[s:raw.find('</script>', s)]
-    return json.loads(
-        script[script.find('{'):].rstrip(';'))['page']['content']['article']
+    data = json.loads(script[script.find('{'):].rstrip(';'))['page']['content']
+    if 'article' in data:
+        return data['article']
+    return data['prismarticle']


 def parse_contributors(grp):
@ -32,16 +34,17 @@ def parse_contributors(grp):


 def parse_lead_image(media):
-    if 'dsc' in media['image']:
-        yield '<p><div><img src="{}" alt="{}"></div>'.format(
-            escape(media['image']['src'], True), escape(media['image']['dsc'], True))
-    else:
-        yield '<p><div><img src="{}"></div>'.format(escape(media['image']['src'], True))
-    if 'caption' in media:
-        yield '<div class="cap">' + media['caption'] + '</div>'
-    if 'credit' in media:
-        yield '<div class="cred">' + media['credit'] + '</div>'
-    yield '</p>'
+    if 'image' in media:
+        if 'dsc' in media['image']:
+            yield '<p><div><img src="{}" alt="{}"></div>'.format(
+                escape(media['image']['src'], True), escape(media['image']['dsc'], True))
+        else:
+            yield '<p><div><img src="{}"></div>'.format(escape(media['image']['src'], True))
+        if 'caption' in media:
+            yield '<div class="cap">' + media['caption'] + '</div>'
+        if 'credit' in media:
+            yield '<div class="cred">' + media['credit'] + '</div>'
+        yield '</p>'


 def parse_body(item):
--- a/recipes/natgeohis.recipe
+++ b/recipes/natgeohis.recipe
@ -18,8 +18,10 @@ def classes(classes):
 def extract_json(raw):
    s = raw.find("window['__natgeo__']")
    script = raw[s:raw.find('</script>', s)]
-    return json.loads(
-        script[script.find('{'):].rstrip(';'))['page']['content']['article']
+    data = json.loads(script[script.find('{'):].rstrip(';'))['page']['content']
+    if 'article' in data:
+        return data['article']
+    return data['prismarticle']


 def parse_contributors(grp):
@ -31,16 +33,17 @@ def parse_contributors(grp):


 def parse_lead_image(media):
-    if 'dsc' in media['image']:
-        yield '<p><div><img src="{}" alt="{}"></div>'.format(
-            escape(media['image']['src'], True), escape(media['image']['dsc'], True))
-    else:
-        yield '<p><div><img src="{}"></div>'.format(escape(media['image']['src'], True))
-    if 'caption' in media:
-        yield '<div class="cap">' + media['caption'] + '</div>'
-    if 'credit' in media:
-        yield '<div class="cred">' + media['credit'] + '</div>'
-    yield '</p>'
+    if 'image' in media:
+        if 'dsc' in media['image']:
+            yield '<p><div><img src="{}" alt="{}"></div>'.format(
+                escape(media['image']['src'], True), escape(media['image']['dsc'], True))
+        else:
+            yield '<p><div><img src="{}"></div>'.format(escape(media['image']['src'], True))
+        if 'caption' in media:
+            yield '<div class="cap">' + media['caption'] + '</div>'
+        if 'credit' in media:
+            yield '<div class="cred">' + media['credit'] + '</div>'
+        yield '</p>'


 def parse_body(item):
--- a/recipes/natgeomag.recipe
+++ b/recipes/natgeomag.recipe
@ -23,8 +23,10 @@ def classes(classes):
 def extract_json(raw):
    s = raw.find("window['__natgeo__']")
    script = raw[s:raw.find('</script>', s)]
-    return json.loads(
-        script[script.find('{'):].rstrip(';'))['page']['content']['article']
+    data = json.loads(script[script.find('{'):].rstrip(';'))['page']['content']
+    if 'article' in data:
+        return data['article']
+    return data['prismarticle']


 def parse_contributors(grp):
@ -36,16 +38,17 @@ def parse_contributors(grp):


 def parse_lead_image(media):
-    if 'dsc' in media['image']:
-        yield '<p><div><img src="{}" alt="{}"></div>'.format(
-            escape(media['image']['src'], True), escape(media['image']['dsc'], True))
-    else:
-        yield '<p><div><img src="{}"></div>'.format(escape(media['image']['src'], True))
-    if 'caption' in media:
-        yield '<div class="cap">' + media['caption'] + '</div>'
-    if 'credit' in media:
-        yield '<div class="cred">' + media['credit'] + '</div>'
-    yield '</p>'
+    if 'image' in media:
+        if 'dsc' in media['image']:
+            yield '<p><div><img src="{}" alt="{}"></div>'.format(
+                escape(media['image']['src'], True), escape(media['image']['dsc'], True))
+        else:
+            yield '<p><div><img src="{}"></div>'.format(escape(media['image']['src'], True))
+        if 'caption' in media:
+            yield '<div class="cap">' + media['caption'] + '</div>'
+        if 'credit' in media:
+            yield '<div class="cred">' + media['credit'] + '</div>'
+        yield '</p>'


 def parse_body(item):