python语音识别新选择openai出品的whisper

最新推荐文章于 2024-06-22 12:11:42 发布

老练的小白

最新推荐文章于 2024-06-22 12:11:42 发布

阅读量634

点赞数 10

分类专栏： python NLP 文章标签： python 语音识别 whisper

本文链接：https://blog.csdn.net/qq603288332/article/details/139357967

版权

python 同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

NLP

1 篇文章 0 订阅

订阅专栏

简介

语音识别包以前我用的最顺手的就是SpeechRecognition好用方便，最重要的是效果还不错！
但是现在用的伙伴们对这个错误不陌生吧！speech_recognition.exceptions.RequestError: recognition connection failed: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应，连接尝试失败。脑干直接干蒙圈！！！

解决

后来一查代码是因为国内把谷歌接口啥的不友好了，如果您有香港服务器那没事！于是点进源码看一下recognize_google这个方法已经不用了，而是改成了recognize_google_cloud，但是这个里面没有免费的key来使用了，于是我去官网上注册一下，但是万万没想到也打不开。。。。。

没办法了看一下py官方文档（最后更新在2022年），文档提供了几种识别后端：
在这里插入图片描述
我搜了有的小伙伴说用recognize_bing这个方法，但是上述文档说是已经弃用了，由于国情方面智能选择上述中离线的方法：

CMU Sphinx：是卡内基梅隆大学开发的语音识别包，对英文输出还好，但是中文效果有点差，并且通过看文档发现模型都是19年之前的，就直接放弃了不想试了。
Whisper Api：各种文档都能打开好评！！！！它是openai开发的一种通用的语音识别模型。它是在一个包含不同音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。提供了多种模型：

import whisper
model = whisper.load_model("base")
result = model.transcribe("test.mp3")
print(result["text"])

在这里插入图片描述
果然可以了！！！！简单句子可以，至于长句子还需要去调试，如果有更好的方法可以留言交流一下奥！

网上教程千千万，只有这里最全面，看完记得点个赞！！！！

老练的小白

关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python语音识别新选择openai出品的whisper

语音识别包以前我用的最顺手的就是好用方便，最重要的是效果还不错！但是现在用的伙伴们对这个错误不陌生吧！脑干直接干蒙圈！！！
复制链接

扫一扫

专栏目录