35 lines
2.2 KiB
Markdown
35 lines
2.2 KiB
Markdown
# Голосовой ввод и озвучка (STT/TTS)
|
||
|
||
Статус: `pending`
|
||
|
||
## Что сделано
|
||
|
||
- Добавлен голосовой ввод в:
|
||
- личный чат;
|
||
- форму ответа в канале;
|
||
- форму нового сообщения в канале;
|
||
- форму ответа в треде.
|
||
- Добавлен инструмент «Прочесть вслух» для текста в чате.
|
||
- Добавлен экран `Настройки инструментов ввода`:
|
||
- STT через OpenAI (base URL, API key, качество, модель);
|
||
- TTS через Browser / Piper HTTP / OpenAI TTS.
|
||
- Для TTS добавлена кнопка «Проверить озвучку».
|
||
- Если инструмент не настроен, показывается предложение перейти в настройки.
|
||
- Настройки сохраняются локально и сохраняются между сессиями.
|
||
|
||
## Как проверять
|
||
|
||
1. Открыть `Настройки -> Настройки инструментов ввода`.
|
||
2. В блоке STT заполнить OpenAI API key (и при необходимости URL/модель).
|
||
3. В блоке TTS выбрать OpenAI, заполнить API key, при необходимости модель/голос.
|
||
4. Нажать «Проверить озвучку» и убедиться, что звук воспроизводится.
|
||
5. Открыть чат/канал/тред, нажать кнопку `🎤`, записать голос, нажать `OK`.
|
||
6. Убедиться, что распознанный текст подставился в поле ввода.
|
||
7. Отправить сообщение и проверить, что оно дошло.
|
||
|
||
## Ожидаемый результат
|
||
|
||
- Голосовой ввод работает во всех указанных формах.
|
||
- Озвучка через OpenAI TTS работает с тем же ключом, что и STT (если ключ имеет нужные права).
|
||
- При пустых настройках показывается понятный переход в настройки.
|