Linux系统下安装离线语音转文字工具

简介:

Vosk是言语识别工具包。Vosk最好的事情是:

  1. 支持二十+种语言 - 中文,英语,印度英语,德语,法语,西班牙语,葡萄牙语,俄语,土耳其语,越南语,意大利语,荷兰人,加泰罗尼亚语,阿拉伯, 希腊语, 波斯语, 菲律宾语,乌克兰语, 哈萨克语, 瑞典语, 日语, 世界语, 印地语, 捷克语, 波兰语, 乌兹别克语, 韩国语, 塔吉克语
  2. 移动设备上脱机工作-Raspberry Pi,Android,iOS
  3. 使用简单的 pip3 install vosk 安装
  4. 每种语言的手提式模型只有是50Mb, 但还有更大的服务器模型可用
  5. 提供流媒体API,以提供最佳用户体验(与流行的语音识别python包不同)
  6. 还有用于不同编程语言的包装器-java / csharp / javascript等
  7. 可以快速重新配置词汇以实现最佳准确性
  8. 支持说话人识别

安装环境:

CPU架构:X64、armv7l

操作系统:Ubuntu20.04

项目源码:https://github.com/alphacep/vosk-api

官方安装步骤:https://alphacephei.com/vosk/install

安装步骤:

1. 安装python3(3.5-3.9):apt install python3

2. 安装pip3:apt install python3-pip

3. 安装Vosk:pip3 install vosk

如果默认不是0.3.45版本,需手动指定:pip3 install vosk-0.3.45-py3-none-linux_armv7l.whl

或 pip3 install vosk-0.3.45-py3-none-linux_x86_64.whl

4. 下载vosk-api源码:git clone https://github.com/alphacep/vosk-api

5. cd vosk-api/src

6.下载预编译libvosk.so

wget vosk-linux-armv7l-0.3.45.zip  或 wget vosk-linux-x86_64-0.3.45.zip

unzip vosk-linux-armv7l-0.3.45.zip 或 unzip vosk-linux-x86_64-0.3.45.zip

cp vosk-linux-x86_64-0.3.45/libvosk.so ./

7. cd vosk-api/python

8. python3 setup.py install

9. apt install ffmpeg

错误解决办法:

ssl证书错误:sudo apt update && sudo apt install --reinstall ca-certificates

使用例子:

vosk-transcriber -i test.mp4 -o test.txt
vosk-transcriber -i test.mp4 -t srt -o test.srt
vosk-transcriber -l cn -i test.m4a -t srt -o test.srt
vosk-transcriber --list-languages

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值