ЛР 3.5 - распознавание речи

  1. На ВМ ast22 установите пакеты, необходимые для работы системы распознавания Vosk:
    apt install -y python3 python3-pip ffmpeg unzip rename pipx
  2. Установите Vosk и определите переменные путей (возможно, потребуется перезайти в систему):
    pipx install vosk
    pipx ensurepath
  3. Скачайте и распакуйте голосовые модели с официального сайта:
    wget https://alphacephei.com/vosk/models/vosk-model-small-ru-0.22.zip
    unzip vosk-model-small-ru-0.22.zip
  4. Создайте в корневой директории каталог /mixmon и включите в астериске запись разговоров:
exten => 300,1,Wait(2)
same => n,Set(MONITOR_FILE=/mixmon/${UNIQUEID})
same => n,MixMonitor(${MONITOR_FILE}.wav)
same => n,Playback(tt-monkeysintro)
same => n,Hangup()
  1. Вернитесь в консоль и протестируйте распознавание текста:
    vosk-transcriber -i /mixmon/<tab> -o test.txt -m vosk-model-small-ru-0.22
  2. Реализуйте автоматическое распознавание текста (по завершению звонка или по расписанию).