语音识别之实时语音互动

最新推荐文章于 2024-09-06 19:07:02 发布

郎郎不会飞

最新推荐文章于 2024-09-06 19:07:02 发布

阅读量595

点赞数

分类专栏：语音识别文章标签：语音识别百度 python

本文链接：https://blog.csdn.net/weixin_44747240/article/details/104695378

版权

本文记录了利用百度API和Python进行实时语音互动的实现过程。通过创建百度智能云的语音识别应用，获取必要的ID和密钥，然后采用不下载SDK的方式，根据文档组装URL获取token，将本地音频转化为JSON格式发送到服务器进行识别，实现了语音的双向互动。由于无法展示视频，实际效果未能充分展现。

摘要由CSDN通过智能技术生成

语音识别之进行实时语音互动

在这里插入图片描述
今天心血来潮，利用百度API语音识别，用python尝试做了一下语音识别的小互动，感觉还不错，记录一下过程，分享一下。已经完成了互动的过程，你说一句它说一句，无奈不能上传视频，效果不明显。
用到的东西呢
主要的是利用百度API
首先呢，需要拥有一个百度账号，登录百度智能云:https://ai.baidu.com/tech/speech，然后建立一个语音识别的应用。会得到ID\APIKEY\SecretKey
在这里插入图片描述
其中可以用两种方式调用：
可以下载使用SDK
不下载使用SDK：根据文档组装url获取token，处理本地音频以JSON格式POST到百度语音识别服务器，获得返回结果

#百度语音
APP_ID = 'xxxxxxx'
base_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
APIKey = "xxxxxxxxx"
SecretKey = "xxxxxxxxxxxx"
client = AipSpeech(APP_ID, APIKey, SecretKey)
HOST = base_url % (APIKey, SecretKey)
#获取token
def getToken(host):
    res = requests.post(host)
    return res.json()['access_token']

录音及识别相关函数

#保存语音文件
def save_wave_file(filepath, data):
    wf = wave.open(filepath, 'wb'

最低0.47元/天解锁文章

郎郎不会飞

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录