使用python和IBM speech to text 进行 语音识别

 

使用python和IBM speech to text 进行 语音识别

标签: 语音识别ibmpythonapi
  1403人阅读  评论(0)  收藏  举报
  分类:
 

wav 转 text ,感觉 还是IBM 的 speech to text 比较靠得住。

比百度的语音识别API好上太多。

[html]  view plain  copy
  1. https://speech-to-text-demo.mybluemix.net/  

--------------------------------------------------------------------

注册拿到 帐号密码后, 

有一个包比较 方便 调用

是SpeechRecogntion

[html]  view plain  copy
  1. https://pypi.python.org/pypi/SpeechRecognition/  

pip install 或者 按照说明 安装就行了

---------------------------------------------------------------------

SpeechRecognition包含多个网站的API 

然而Google的并不能用,AT&T的没试过。

--------------------------------------------------------------------

在debian 上测试的时候有个问题,需要 管理 员权限 。

可能是内部有过wav  2 flac 然后把临时文件 保存在dist-package下了,

--------------------------------------------------------------------

SpeechRecognition有示例代码wav_transcribe.py;

如果用于识别中文,需要在speechrecognition/__init__.py中,

修改recognize_ibm函数的482行

[python]  view plain  copy
  1. assert language in ["en-US""es-ES""ja-JP"], "`language` must be a valid language."  
增加"zh-CN"项,

[python]  view plain  copy
  1. assert language in ["en-US""es-ES""ja-JP""zh-CN"], "`language` must be a valid language."  

---------------------------------------------------------------------

SpeechRecognition的用法 如下

[python]  view plain  copy
  1. import speech_recognition as sr  

读wav文件

[python]  view plain  copy
  1. r = sr.Recognizer()  
  2. with sr.WavFile(path) as source:  
  3.     audio = r.record(source)  
然后可以调用 recognize_ibm 返回识别结果,是utf8格式的,一般写起来 会有些问题

[python]  view plain  copy
  1. IBM_USERNAME = 'XXXXXXXX'  
  2. IBM_PASSWORD= 'XXXXXXXX'  
  3.   
  4. text = r.recognize_ibm(audio, username = IBM_USERNAME, password = IBM_PASSWORD, language = 'zh-CN')  


text 就是识别结果,可能会有编码问题之类的。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值