开源VOSK引擎免费语音转文字部署

本文详细介绍了如何在Windows环境下部署开源的VOSK语音识别引擎,包括Python环境配置、VOSK API库安装、中文语音模型下载、ffmpeg的获取,以及使用Notepad++创建并运行voice2text.py脚本来转换语音为文字。最后,文章提到了识别结果的查看和处理方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

步骤1:安装Python3环境
前往 Download Python | Python.org 下载Windows环境版本(Python 3.8以上)。安装过程中选中“Add Python directory to 'PATH' environment variable”。选中之后,Python可以像系统自带命令一样,在所有CMD目录下运行。否则每次执行Python都需要输入它的目录位置。其他选项按默认即可。

(可选操作)步骤1a:替换下载镜像为清华大学镜像源
在命令行输入 pip config set global.index-url Simple Index

这样对于国内用户来说下载速度会更快

步骤2:安装VOSK API库
打开CMD(命令提示符)输入 pip install vosk

步骤3:配置目录并下载语音模型
在桌面创建 vosk 目录。

前往 VOSK Models 下载中文语音模型。

或者直接点击下面的链接下载,并解压到vosk目录下。将解压出来的目录重命名为 “model”(不含引号)。

vosk-model-cn-0.1.zip
195M TBD Big narrowband Chinese model f

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值