python语音识别新选择openai出品的whisper

1 篇文章 0 订阅

简介

语音识别包以前我用的最顺手的就是SpeechRecognition好用方便,最重要的是效果还不错!
但是现在用的伙伴们对这个错误不陌生吧!speech_recognition.exceptions.RequestError: recognition connection failed: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。脑干直接干蒙圈!!!

解决

后来一查代码是因为国内把谷歌接口啥的不友好了,如果您有香港服务器那没事!于是点进源码看一下recognize_google这个方法已经不用了,而是改成了recognize_google_cloud,但是这个里面没有免费的key来使用了,于是我去官网上注册一下,但是万万没想到也打不开。。。。。

没办法了看一下py官方文档(最后更新在2022年),文档提供了几种识别后端:
在这里插入图片描述
我搜了有的小伙伴说用recognize_bing这个方法,但是上述文档说是已经弃用了,由于国情方面智能选择上述中离线的方法:

  1. CMU Sphinx:是卡内基梅隆大学开发的语音识别包,对英文输出还好,但是中文效果有点差,并且通过看文档发现模型都是19年之前的,就直接放弃了不想试了。
  2. Whisper Api:各种文档都能打开好评!!!!它是openai开发的一种通用的语音识别模型。它是在一个包含不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。提供了多种模型:
    在这里插入图片描述
import whisper
model = whisper.load_model("base")
result = model.transcribe("test.mp3")
print(result["text"])

在这里插入图片描述
果然可以了!!!!简单句子可以,至于长句子还需要去调试,如果有更好的方法可以留言交流一下奥!

网上教程千千万,只有这里最全面,看完记得点个赞!!!!

  • 10
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值