SHiNE-server/Dev_Docs/Pending_Features/вроде сделанное/2026-05-13_0201_голосовые-инструменты-openai-tts-и-stt.md

2.2 KiB
Raw Blame History

Голосовой ввод и озвучка (STT/TTS)

Статус: pending

Что сделано

  • Добавлен голосовой ввод в:
    • личный чат;
    • форму ответа в канале;
    • форму нового сообщения в канале;
    • форму ответа в треде.
  • Добавлен инструмент «Прочесть вслух» для текста в чате.
  • Добавлен экран Настройки инструментов ввода:
    • STT через OpenAI (base URL, API key, качество, модель);
    • TTS через Browser / Piper HTTP / OpenAI TTS.
  • Для TTS добавлена кнопка «Проверить озвучку».
  • Если инструмент не настроен, показывается предложение перейти в настройки.
  • Настройки сохраняются локально и сохраняются между сессиями.

Как проверять

  1. Открыть Настройки -> Настройки инструментов ввода.
  2. В блоке STT заполнить OpenAI API key (и при необходимости URL/модель).
  3. В блоке TTS выбрать OpenAI, заполнить API key, при необходимости модель/голос.
  4. Нажать «Проверить озвучку» и убедиться, что звук воспроизводится.
  5. Открыть чат/канал/тред, нажать кнопку 🎤, записать голос, нажать OK.
  6. Убедиться, что распознанный текст подставился в поле ввода.
  7. Отправить сообщение и проверить, что оно дошло.

Ожидаемый результат

  • Голосовой ввод работает во всех указанных формах.
  • Озвучка через OpenAI TTS работает с тем же ключом, что и STT (если ключ имеет нужные права).
  • При пустых настройках показывается понятный переход в настройки.