MobiReader only reads part of file when getting metadata

2025-08-30 23:00:21 -04:00 · 2009-04-11 19:32:39 -04:00 · 2009-04-11 19:32:39 -04:00 · b963cdc581
commit b963cdc581
parent 316b5670c5
1 changed files with 79 additions and 22 deletions
--- a/src/calibre/ebooks/mobi/reader.py
+++ b/src/calibre/ebooks/mobi/reader.py
@ -157,6 +157,62 @@ class BookHeader(object):
                self.exth.mi.language = self.language
 class MetadataHeader(BookHeader):
    def __init__(self, stream, log):
        self.stream = stream
        self.ident = self.identity()
        self.num_sections = self.section_count()
        if self.num_sections >= 2:
            header = self.header()
            BookHeader.__init__(self, header, self.ident, None, log)
        else:
            self.exth = None
    def identity(self):
        self.stream.seek(60)
        ident = self.stream.read(8).upper()
        if ident not in ['BOOKMOBI', 'TEXTREAD']:
            raise MobiError('Unknown book type: %s' % ident)
        return ident
    def section_count(self):
        self.stream.seek(76)
        return struct.unpack('>H', self.stream.read(2))[0]
    def section_offset(self, number):
        self.stream.seek(78+number*8)
        return struct.unpack('>LBBBB', self.stream.read(8))[0]
    def header(self):
        section_headers = []
        # First section with the metadata
        section_headers.append(self.section_offset(0))
        # Second section used to get the lengh of the first
        section_headers.append(self.section_offset(1))
        end_off = section_headers[1]
        off = section_headers[0]
        self.stream.seek(off)
        return self.stream.read(end_off - off)
    def section_data(self, number):
        start = self.section_offset(number)
        if number == self.num_sections -1:
            end = os.stat(self.stream.name).st_size
        else:
            end = self.section_offset(number + 1)
        self.stream.seek(start)
        return self.stream.read(end - start)
 class MobiReader(object):
    PAGE_BREAK_PAT = re.compile(r'(<[/]{0,1}mbp:pagebreak\s*[/]{0,1}>)+', re.IGNORECASE)
    IMAGE_ATTRS = ('lowrecindex', 'recindex', 'hirecindex')
@ -414,7 +470,7 @@ class MobiReader(object):
    def create_opf(self, htmlfile, guide=None, root=None):
        mi = getattr(self.book_header.exth, 'mi', self.embedded_mi)
        if mi is None:
-            mi = MetaInformation(self.title, [_('Unknown')])
+            mi = MetaInformation(self.book_header.title, [_('Unknown')])
        opf = OPFCreator(os.path.dirname(htmlfile), mi)
        if hasattr(self.book_header.exth, 'cover_offset'):
            opf.cover = 'images/%05d.jpg'%(self.book_header.exth.cover_offset+1)
@ -595,25 +651,26 @@ class MobiReader(object):
 def get_metadata(stream):
    from calibre.utils.logging import Log
    log = Log()
-    mr = MobiReader(stream, log)
+    
-    if mr.book_header.exth is None:
+    mi = MetaInformation(stream.name, [_('Unknown')])
-        mi = MetaInformation(mr.name, [_('Unknown')])
+    try:
-    else:
+        mh = MetadataHeader(stream, log)
-        mi = mr.create_opf('dummy.html')[0]
+
-        try:
+        if mh.exth is not None:
-            if hasattr(mr.book_header.exth, 'cover_offset'):
+            if mh.exth.mi is not None:
-                cover_index = mr.book_header.first_image_index + \
+                mi = mh.exth.mi
-                              mr.book_header.exth.cover_offset
+            
-                data  = mr.sections[int(cover_index)][0]
+        if hasattr(mh.exth, 'cover_offset'):
-            else:
+            cover_index = mh.first_image_index + mh.exth.cover_offset
-                data  = mr.sections[mr.book_header.first_image_index][0]
+            data  = mh.section_data(int(cover_index))
-            buf = cStringIO.StringIO(data)
+        else:
-            im = PILImage.open(buf)
+            data  = mh.section_data(mh.first_image_index)
-            obuf = cStringIO.StringIO()
+        buf = cStringIO.StringIO(data)
-            im.convert('RGBA').save(obuf, format='JPEG')
+        im = PILImage.open(buf)
-            mi.cover_data = ('jpg', obuf.getvalue())
+        obuf = cStringIO.StringIO()
-        except:
+        im.convert('RGBA').save(obuf, format='JPEG')
-            log.exception()
+        mi.cover_data = ('jpg', obuf.getvalue())
    except:
        log.exception()
    return mi