py3: Port urllib in metadata sources

2025-07-09 03:04:10 -04:00 · 2019-04-01 15:30:44 +05:30 · 2019-04-01 15:30:44 +05:30 · e0205790b9
commit e0205790b9
parent 96f4c4c3a2
9 changed files with 43 additions and 14 deletions
--- a/src/calibre/ebooks/metadata/sources/amazon.py
+++ b/src/calibre/ebooks/metadata/sources/amazon.py
@ -12,7 +12,10 @@ try:
 except ImportError:
    from Queue import Empty, Queue
 from threading import Thread
-from urlparse import urlparse
+try:
    from urllib.parse import urlparse
 except ImportError:
    from urlparse import urlparse
 from calibre import as_unicode, browser, random_user_agent
 from calibre.ebooks.metadata import check_isbn
@ -579,7 +582,10 @@ class Worker(Thread):  # Get details {{{
        return sanitize_comments_html(desc)
    def parse_comments(self, root, raw):
-        from urllib import unquote
+        try:
            from urllib.parse import unquote
        except ImportError:
            from urllib import unquote
        ans = ''
        ns = tuple(self.selector('#bookDescription_feature_div noscript'))
        if ns:
@ -1048,7 +1054,10 @@ class Amazon(Source):
    def create_query(self, log, title=None, authors=None, identifiers={},  # {{{
                     domain=None, for_amazon=True):
-        from urllib import urlencode
+        try:
            from urllib.parse import urlencode
        except ImportError:
            from urllib import urlencode
        if domain is None:
            domain = self.domain
--- a/src/calibre/ebooks/metadata/sources/big_book_search.py
+++ b/src/calibre/ebooks/metadata/sources/big_book_search.py
@ -11,7 +11,10 @@ from calibre.ebooks.metadata.sources.base import Source, Option
 def get_urls(br, tokens):
-    from urllib import quote_plus
+    try:
        from urllib.parse import quote_plus
    except ImportError:
        from urllib import quote_plus
    from mechanize import Request
    from lxml import html
    escaped = [quote_plus(x.encode('utf-8')) for x in tokens if x and x.strip()]
--- a/src/calibre/ebooks/metadata/sources/douban.py
+++ b/src/calibre/ebooks/metadata/sources/douban.py
@ -178,7 +178,10 @@ class Douban(Source):
    # }}}
    def create_query(self, log, title=None, authors=None, identifiers={}):  # {{{
-        from urllib import urlencode
+        try:
            from urllib.parse import urlencode
        except ImportError:
            from urllib import urlencode
        SEARCH_URL = 'https://api.douban.com/book/subjects?'
        ISBN_URL = 'https://api.douban.com/book/subject/isbn/'
        SUBJECT_URL = 'https://api.douban.com/book/subject/'
--- a/src/calibre/ebooks/metadata/sources/edelweiss.py
+++ b/src/calibre/ebooks/metadata/sources/edelweiss.py
@ -234,7 +234,10 @@ class Edelweiss(Source):
    # }}}
    def create_query(self, log, title=None, authors=None, identifiers={}):
-        from urllib import urlencode
+        try:
            from urllib.parse import urlencode
        except ImportError:
            from urllib import urlencode
        import time
        BASE_URL = ('https://www.edelweiss.plus/GetTreelineControl.aspx?'
        'controlName=/uc/listviews/controls/ListView_data.ascx&itemID=0&resultType=32&dashboardType=8&itemType=1&dataType=products&keywordSearch&')
--- a/src/calibre/ebooks/metadata/sources/google.py
+++ b/src/calibre/ebooks/metadata/sources/google.py
@ -199,7 +199,10 @@ class GoogleBooks(Source):
    # }}}
    def create_query(self, log, title=None, authors=None, identifiers={}):  # {{{
-        from urllib import urlencode
+        try:
            from urllib.parse import urlencode
        except ImportError:
            from urllib import urlencode
        BASE_URL = 'https://books.google.com/books/feeds/volumes?'
        isbn = check_isbn(identifiers.get('isbn', None))
        q = ''
--- a/src/calibre/ebooks/metadata/sources/google_images.py
+++ b/src/calibre/ebooks/metadata/sources/google_images.py
@ -65,7 +65,10 @@ class GoogleImages(Source):
    def get_image_urls(self, title, author, log, abort, timeout):
        from calibre.utils.cleantext import clean_ascii_chars
-        from urllib import urlencode
+        try:
            from urllib.parse import urlencode
        except ImportError:
            from urllib import urlencode
        import json
        from collections import OrderedDict
        ans = OrderedDict()
--- a/src/calibre/ebooks/metadata/sources/identify.py
+++ b/src/calibre/ebooks/metadata/sources/identify.py
@ -12,8 +12,7 @@ from datetime import datetime
 from threading import Thread
 from io import BytesIO
 from operator import attrgetter
-from urlparse import urlparse
+from polyglot.urllib import urlparse, quote
 from urllib import quote
 from calibre.customize.ui import metadata_plugins, all_metadata_plugins
 from calibre.ebooks.metadata import check_issn, authors_to_sort_string
--- a/src/calibre/ebooks/metadata/sources/ozon.py
+++ b/src/calibre/ebooks/metadata/sources/ozon.py
@ -57,12 +57,15 @@ class Ozon(Source):
    )
    def get_book_url(self, identifiers):  # {{{
-        import urllib2
+        try:
            from urllib.parse import quote
        except ImportError:
            from urllib import quote
        ozon_id = identifiers.get('ozon', None)
        res = None
        if ozon_id:
            # no affiliateId is used in search/detail
-            url = '{}/context/detail/id/{}'.format(self.ozon_url, urllib2.quote(ozon_id), _get_affiliateId())
+            url = '{}/context/detail/id/{}'.format(self.ozon_url, quote(ozon_id), _get_affiliateId())
            res = ('ozon', ozon_id, url)
        return res
--- a/src/calibre/ebooks/metadata/sources/search_engines.py
+++ b/src/calibre/ebooks/metadata/sources/search_engines.py
@ -8,8 +8,11 @@ import json
 import re
 import time
 from collections import defaultdict, namedtuple
-from urllib import quote_plus, urlencode
+try:
-from urlparse import parse_qs
+    from urllib.parse import parse_qs, quote_plus, urlencode
 except ImportError:
    from urlparse import parse_qs
    from urllib import quote_plus, urlencode
 from lxml import etree