ЛР 3.5 - распознавание речи
- На ВМ ast22 установите пакеты, необходимые для работы системы распознавания Vosk:
apt install -y python3 python3-pip ffmpeg unzip rename pipx
- Установите Vosk и определите переменные путей (возможно, потребуется перезайти в систему):
pipx install vosk
pipx ensurepath
- Скачайте и распакуйте голосовые модели с официального сайта:
wget https://alphacephei.com/vosk/models/vosk-model-small-ru-0.22.zip
unzip vosk-model-small-ru-0.22.zip
- Создайте в корневой директории каталог /mixmon и включите в астериске запись разговоров:
exten => 300,1,Wait(2)
same => n,Set(MONITOR_FILE=/mixmon/${UNIQUEID})
same => n,MixMonitor(${MONITOR_FILE}.wav)
same => n,Playback(tt-monkeysintro)
same => n,Hangup()
- Вернитесь в консоль и протестируйте распознавание текста:
vosk-transcriber -i /mixmon/<tab> -o test.txt -m vosk-model-small-ru-0.22
- Реализуйте автоматическое распознавание текста (по завершению звонка или по расписанию).