SHiNE-server/Dev_Docs/Pending_Features/2026-05-13_0201_голосовые-инструменты-openai-tts-и-stt.md

35 lines
2.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Голосовой ввод и озвучка (STT/TTS)
Статус: `pending`
## Что сделано
- Добавлен голосовой ввод в:
- личный чат;
- форму ответа в канале;
- форму нового сообщения в канале;
- форму ответа в треде.
- Добавлен инструмент «Прочесть вслух» для текста в чате.
- Добавлен экран `Настройки инструментов ввода`:
- STT через OpenAI (base URL, API key, качество, модель);
- TTS через Browser / Piper HTTP / OpenAI TTS.
- Для TTS добавлена кнопка «Проверить озвучку».
- Если инструмент не настроен, показывается предложение перейти в настройки.
- Настройки сохраняются локально и сохраняются между сессиями.
## Как проверять
1. Открыть `Настройки -> Настройки инструментов ввода`.
2. В блоке STT заполнить OpenAI API key (и при необходимости URL/модель).
3. В блоке TTS выбрать OpenAI, заполнить API key, при необходимости модель/голос.
4. Нажать «Проверить озвучку» и убедиться, что звук воспроизводится.
5. Открыть чат/канал/тред, нажать кнопку `🎤`, записать голос, нажать `OK`.
6. Убедиться, что распознанный текст подставился в поле ввода.
7. Отправить сообщение и проверить, что оно дошло.
## Ожидаемый результат
- Голосовой ввод работает во всех указанных формах.
- Озвучка через OpenAI TTS работает с тем же ключом, что и STT (если ключ имеет нужные права).
- При пустых настройках показывается понятный переход в настройки.