Start work on windows tts config

2025-07-09 03:04:10 -04:00 · 2020-12-07 21:13:07 +05:30 · 2020-12-07 21:13:07 +05:30 · a50c2db7ae
commit a50c2db7ae
parent 0e3bc56602
2 changed files with 240 additions and 5 deletions
--- a/src/calibre/gui2/tts/windows.py
+++ b/src/calibre/gui2/tts/windows.py
@ -19,15 +19,20 @@ class Client:
    def escape_marked_text(cls, text):
        return prepare_string_for_xml(text)

-    def __init__(self, settings, dispatch_on_main_thread):
+    def __init__(self, settings=None, dispatch_on_main_thread=lambda f: f()):
        from calibre.utils.windows.winsapi import ISpVoice
-        self.sp_voice = ISpVoice()
        self.events_thread = Thread(name='SAPIEvents', target=self.wait_for_events, daemon=True)
-        self.events_thread.start()
+        self.sp_voice = ISpVoice()
+        self.default_system_rate = self.sp_voice.get_current_rate()
+        self.default_system_voice = self.sp_voice.get_current_voice()
+        self.default_system_sound_output = self.sp_voice.get_current_sound_output()
        self.current_stream_number = None
        self.current_callback = None
        self.dispatch_on_main_thread = dispatch_on_main_thread
+        self.current_marked_text = self.last_mark = None
        self.status = {'synthesizing': False, 'paused': False}
+        self.events_thread.start()
+        self.apply_settings(settings)

    def __del__(self):
        if self.sp_voice is not None:
@ -36,6 +41,12 @@ class Client:
            self.sp_voice = None
    shutdown = __del__

+    def apply_settings(self, new_settings=None):
+        settings = new_settings or {}
+        self.sp_voice.set_current_rate(settings.get('rate', self.default_system_rate))
+        self.sp_voice.set_current_voice(settings.get('voice') or self.default_system_voice)
+        self.sp_voice.set_current_sound_output(settings.get('sound_output') or self.default_system_sound_output)
+
    def wait_for_events(self):
        while True:
            if self.sp_voice.wait_for_event() is False:
@ -49,6 +60,7 @@ class Client:
        c = self.current_callback
        for (stream_number, event_type, event_data) in self.sp_voice.get_events():
            if event_type == SPEI_TTS_BOOKMARK:
+                self.last_mark = event_data
                event = Event(EventType.mark, event_data)
            elif event_type == SPEI_START_INPUT_STREAM:
                event = Event(EventType.begin)
@ -70,15 +82,21 @@ class Client:
            SPF_ASYNC, SPF_IS_NOT_XML, SPF_PURGEBEFORESPEAK
        )
        self.current_callback = None
+        self.current_marked_text = self.last_mark = None
        self.current_stream_number = self.sp_voice.speak(text, SPF_ASYNC | SPF_PURGEBEFORESPEAK | SPF_IS_NOT_XML, True)

-    def speak_marked_text(self, text, callback):
+    def speak_xml(self, text):
        from calibre_extensions.winsapi import (
            SPF_ASYNC, SPF_IS_XML, SPF_PURGEBEFORESPEAK
        )
-        self.current_callback = callback
        self.current_stream_number = self.sp_voice.speak(text, SPF_ASYNC | SPF_PURGEBEFORESPEAK | SPF_IS_XML, True)

+    def speak_marked_text(self, text, callback):
+        self.current_marked_text = text
+        self.last_mark = None
+        self.current_callback = callback
+        self.speak_xml(text)
+
    def stop(self):
        from calibre_extensions.winsapi import SPF_PURGEBEFORESPEAK
        if self.status['paused']:
@ -102,3 +120,32 @@ class Client:
            self.status = {'synthesizing': True, 'paused': False}
            if self.current_callback is not None:
                self.current_callback(Event(EventType.resume))
+
+    def resume_after_configure(self):
+        if self.status['paused']:
+            mark = self.mark_template.format(self.last_mark)
+            idx = self.current_marked_text.find(mark)
+            if idx == -1:
+                text = self.current_marked_text
+            else:
+                text = self.current_marked_text[idx:]
+            self.speak_xml(text)
+            self.status = {'synthesizing': True, 'paused': False}
+            if self.current_callback is not None:
+                self.current_callback(Event(EventType.resume))
+
+    def get_voice_data(self):
+        ans = getattr(self, 'voice_data', None)
+        if ans is None:
+            ans = self.voice_data = self.sp_voice.get_all_voices()
+        return ans
+
+    def get_sound_outputs(self):
+        ans = getattr(self, 'sound_outputs', None)
+        if ans is None:
+            ans = self.sound_outputs = self.sp_voice.get_all_sound_outputs()
+        return ans
+
+    def config_widget(self, backend_settings, parent):
+        from calibre.gui2.tts.windows_config import Widget
+        return Widget(self, backend_settings, parent)
--- a/src/calibre/gui2/tts/windows_config.py
+++ b/src/calibre/gui2/tts/windows_config.py
@ -0,0 +1,188 @@
+#!/usr/bin/env python
+# vim:fileencoding=utf-8
+# License: GPL v3 Copyright: 2020, Kovid Goyal <kovid at kovidgoyal.net>
+
+from contextlib import suppress
+from PyQt5.Qt import (
+    QAbstractItemView, QAbstractTableModel, QComboBox, QFontMetrics, QFormLayout,
+    QItemSelectionModel, QSlider, QSortFilterProxyModel, Qt, QTableView, QWidget
+)
+
+from calibre.gui2.preferences.look_feel import BusyCursor
+
+
+class VoicesModel(QAbstractTableModel):
+
+    system_default_voice = ''
+
+    def __init__(self, voice_data, parent=None):
+        super().__init__(parent)
+        self.voice_data = voice_data
+
+        def language(x):
+            return x.get('language_display_name') or x['language'] or ''
+
+        self.current_voices = tuple((x['name'], language(x), x['age'], x['gender'], x['id']) for x in voice_data)
+        self.column_headers = _('Name'), _('Language'), _('Age'), _('Gender')
+
+    def rowCount(self, parent=None):
+        return len(self.current_voices) + 1
+
+    def columnCount(self, parent=None):
+        return len(self.column_headers)
+
+    def headerData(self, section, orientation, role=Qt.ItemDataRole.DisplayRole):
+        if role == Qt.ItemDataRole.DisplayRole and orientation == Qt.Orientation.Horizontal:
+            return self.column_headers[section]
+        return super().headerData(section, orientation, role)
+
+    def data(self, index, role=Qt.ItemDataRole.DisplayRole):
+        if role == Qt.ItemDataRole.DisplayRole:
+            row = index.row()
+            with suppress(IndexError):
+                if row == 0:
+                    return (_('System default'), '', '', '')[index.column()]
+                data = self.current_voices[row - 1]
+                col = index.column()
+                ans = data[col] or ''
+                return ans
+        if role == Qt.ItemDataRole.UserRole:
+            row = index.row()
+            with suppress(IndexError):
+                if row == 0:
+                    return self.system_default_voice
+                return self.current_voices[row - 1][4]
+
+    def index_for_voice(self, v):
+        r = 0
+        if v != self.system_default_voice:
+            for i, x in enumerate(self.current_voices):
+                if x['id'] == v:
+                    r = i + i
+                    break
+            else:
+                return
+        return self.index(r, 0)
+
+
+class Widget(QWidget):
+
+    def __init__(self, tts_client, initial_backend_settings=None, parent=None):
+        QWidget.__init__(self, parent)
+        self.l = l = QFormLayout(self)
+        self.tts_client = tts_client
+
+        with BusyCursor():
+            self.voice_data = self.tts_client.get_voice_data()
+            self.default_system_rate = self.tts_client.default_system_rate
+            self.all_sound_outputs = self.tts_client.get_sound_outputs()
+
+        self.speed = s = QSlider(Qt.Orientation.Horizontal, self)
+        s.setMinimumWidth(200)
+        l.addRow(_('&Speed of speech (words per minute):'), s)
+        s.setRange(-10, 10)
+        s.setSingleStep(1)
+
+        self.voices = v = QTableView(self)
+        self.voices_model = VoicesModel(self.voice_data, parent=v)
+        self.proxy_model = p = QSortFilterProxyModel(self)
+        p.setFilterCaseSensitivity(Qt.CaseSensitivity.CaseInsensitive)
+        p.setSourceModel(self.voices_model)
+        v.setModel(p)
+        v.setSelectionBehavior(QAbstractItemView.SelectionBehavior.SelectRows)
+        v.setSortingEnabled(True)
+        v.horizontalHeader().resizeSection(0, QFontMetrics(self.font()).averageCharWidth() * 30)
+        v.verticalHeader().close()
+        v.setSelectionMode(QAbstractItemView.SelectionMode.SingleSelection)
+        v.sortByColumn(0, Qt.SortOrder.AscendingOrder)
+        l.addRow(v)
+
+        self.sound_outputs = so = QComboBox(self)
+        so.addItem(_('System default'), '')
+        for x in self.all_sound_outputs:
+            so.addItem(x.get('description') or x['id'], x['id'])
+        l.addRow(_('Sound output:'), so)
+
+        self.backend_settings = initial_backend_settings or {}
+
+    def restore_to_defaults(self):
+        self.backend_settings = {}
+
+    def sizeHint(self):
+        ans = super().sizeHint()
+        ans.setHeight(max(ans.height(), 600))
+        ans.setWidth(max(ans.width(), 500))
+        return ans
+
+    @property
+    def selected_voice(self):
+        for x in self.voices.selectedIndexes():
+            return x.data(Qt.ItemDataRole.UserRole)
+
+    @selected_voice.setter
+    def selected_voice(self, val):
+        val = val or VoicesModel.system_default_voice
+        idx = self.voices_model.index_for_voice(val)
+        if idx is not None:
+            idx = self.proxy_model.mapFromSource(idx)
+            self.voices.selectionModel().select(idx, QItemSelectionModel.SelectionFlag.ClearAndSelect)
+            self.voices.scrollTo(idx)
+
+    @property
+    def rate(self):
+        return self.speed.value()
+
+    @rate.setter
+    def rate(self, val):
+        val = int(val or self.default_system_rate)
+        self.speed.setValue(val)
+
+    @property
+    def sound_output(self):
+        return self.sound_output.currentData()
+
+    @sound_output.setter
+    def sound_output(self, val):
+        val = val or ''
+        idx = 0
+        if val:
+            q = self.sound_output.findData(val)
+            if q > -1:
+                idx = q
+        self.sound_output.setCurrentIndex(idx)
+
+    @property
+    def backend_settings(self):
+        ans = {}
+        voice = self.selected_voice
+        if voice and voice != VoicesModel.system_default_voice:
+            ans['voice'] = voice
+        rate = self.rate
+        if rate and rate != self.default_system_rate:
+            ans['rate'] = rate
+        so = self.sound_output
+        if so:
+            ans['sound_output'] = so
+        return ans
+
+    @backend_settings.setter
+    def backend_settings(self, val):
+        voice = val.get('voice') or VoicesModel.system_default_voice
+        self.selected_voice = voice
+        self.rate = val.get('rate') or self.default_system_rate
+        self.sound_output = val.get('sound_output') or ''
+
+
+def develop():
+    from calibre.gui2 import Application
+    from calibre.gui2.tts.implementation import Client
+    app = Application([])
+    c = Client()
+    w = Widget(c, {})
+    w.show()
+    app.exec_()
+    print(w.backend_settings)
+
+
+if __name__ == '__main__':
+    develop()