简介:
Vosk是言语识别工具包。Vosk最好的事情是:
- 支持二十+种语言 - 中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越南语,意大利语,荷兰人,加泰罗尼亚语,阿拉伯, 希腊语, 波斯语, 菲律宾语,乌克兰语, 哈萨克语, 瑞典语, 日语, 世界语, 印地语, 捷克语, 波兰语, 乌兹别克语, 韩国语, 塔吉克语
- 移动设备上脱机工作-Raspberry Pi,Android,iOS
- 使用简单的 pip3 install vosk 安装
- 每种语言的手提式模型只有是50Mb, 但还有更大的服务器模型可用
- 提供流媒体API,以提供最佳用户体验(与流行的语音识别python包不同)
- 还有用于不同编程语言的包装器-java / csharp / javascript等
- 可以快速重新配置词汇以实现最佳准确性
- 支持说话人识别
安装环境:
CPU架构:X64、armv7l
操作系统:Ubuntu20.04
项目源码:https://github.com/alphacep/vosk-api
官方安装步骤:https://alphacephei.com/vosk/install
安装步骤:
1. 安装python3(3.5-3.9):apt install python3
2. 安装pip3:apt install python3-pip
3. 安装Vosk:pip3 install vosk
如果默认不是0.3.45版本,需手动指定:pip3 install vosk-0.3.45-py3-none-linux_armv7l.whl
或 pip3 install vosk-0.3.45-py3-none-linux_x86_64.whl
4. 下载vosk-api源码:git clone https://github.com/alphacep/vosk-api
5. cd vosk-api/src
6.下载预编译libvosk.so
wget vosk-linux-armv7l-0.3.45.zip 或 wget vosk-linux-x86_64-0.3.45.zip
unzip vosk-linux-armv7l-0.3.45.zip 或 unzip vosk-linux-x86_64-0.3.45.zip
cp vosk-linux-x86_64-0.3.45/libvosk.so ./
7. cd vosk-api/python
8. python3 setup.py install
9. apt install ffmpeg
错误解决办法:
ssl证书错误:sudo apt update && sudo apt install --reinstall ca-certificates
使用例子:
vosk-transcriber -i test.mp4 -o test.txt
vosk-transcriber -i test.mp4 -t srt -o test.srt
vosk-transcriber -l cn -i test.m4a -t srt -o test.srt
vosk-transcriber --list-languages