搭建本地whisper语音识别

目录

代码仓库

​编辑

选择模型

环境配置

语音识别测试


Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。

代码仓库

GitHub - openai/whisper:通过大规模弱监督实现鲁棒语音识别

方法1.可以通过pip 安装下载,但是呢这种方式对我们并不透明,后面下载模型要找的麻烦一点。

pip install -U openai-whisper

方法2.通过版本源代码zip的方式放置在项目或者环境中

然后我们只需要压缩包里面的文件夹,把文件夹拉到所需项目或者目标环境中:

选择模型

打开我们刚刚复制文件夹内的whisper\__init__.py中,在里面可以看到(我只展示了部分代码)以下各种模型的下载连接:

_MODELS = {
    "tiny.en&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值