使用python和IBM speech to text 进行语音识别

最新推荐文章于 2024-08-13 08:53:48 发布

newHung

最新推荐文章于 2024-08-13 08:53:48 发布

阅读量5.2k

点赞数 1

分类专栏： linux

linux 专栏收录该内容

50 篇文章 0 订阅

订阅专栏

CSDN日报20170303——《百亿互金平台救火故事》程序员2月书讯社区有奖问答--一起舞动酷炫的iOS动画基于Spark的分布式深度学习和认知计算

使用python和IBM speech to text 进行语音识别

标签：语音识别 ibm python api

2015-11-10 17:22 1403人阅读评论(0) 收藏举报

分类：

程序模块（14）

编程语言（13）

wav 转 text ，感觉还是IBM 的 speech to text 比较靠得住。

比百度的语音识别API好上太多。

[html]view plaincopy 
         
 https://speech-to-text-demo.mybluemix.net/  

--------------------------------------------------------------------

注册拿到帐号密码后，

有一个包比较方便调用

是SpeechRecogntion

[html]view plaincopy 
         
 https://pypi.python.org/pypi/SpeechRecognition/  

pip install 或者按照说明安装就行了

---------------------------------------------------------------------

SpeechRecognition包含多个网站的API

然而Google的并不能用，AT&T的没试过。

--------------------------------------------------------------------

在debian 上测试的时候有个问题，需要管理员权限。

可能是内部有过wav 2 flac 然后把临时文件保存在dist-package下了，

--------------------------------------------------------------------

SpeechRecognition有示例代码wav_transcribe.py；

如果用于识别中文，需要在speechrecognition/__init__.py中，

修改recognize_ibm函数的482行

[python]view plaincopy 
         
 assert language in ["en-US", "es-ES", "ja-JP"], "`language` must be a valid language."  

增加"zh-CN"项，

[python]view plaincopy 
         
 assert language in ["en-US", "es-ES", "ja-JP", "zh-CN"], "`language` must be a valid language."  

---------------------------------------------------------------------

SpeechRecognition的用法如下

[python]view plaincopy 
         
 import speech_recognition as sr  

读wav文件

[python]view plaincopy 
         
 r = sr.Recognizer()  
 with sr.WavFile(path) as source:  
     audio = r.record(source)  

然后可以调用 recognize_ibm 返回识别结果，是utf8格式的，一般写起来会有些问题

[python]view plaincopy 
         
 IBM_USERNAME = 'XXXXXXXX'  
 IBM_PASSWORD= 'XXXXXXXX'  
   
 text = r.recognize_ibm(audio, username = IBM_USERNAME, password = IBM_PASSWORD, language = 'zh-CN')  

text 就是识别结果，可能会有编码问题之类的。

newHung

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

使用python和IBM speech to text 进行 语音识别

使用python和IBM speech to text 进行 语音识别

使用python和IBM speech to text 进行语音识别

使用python和IBM speech to text 进行语音识别