语音识别之实时语音互动

本文记录了利用百度API和Python进行实时语音互动的实现过程。通过创建百度智能云的语音识别应用,获取必要的ID和密钥,然后采用不下载SDK的方式,根据文档组装URL获取token,将本地音频转化为JSON格式发送到服务器进行识别,实现了语音的双向互动。由于无法展示视频,实际效果未能充分展现。
摘要由CSDN通过智能技术生成

语音识别之进行实时语音互动

在这里插入图片描述
今天心血来潮,利用百度API语音识别,用python尝试做了一下语音识别的小互动,感觉还不错,记录一下过程,分享一下。已经完成了互动的过程,你说一句它说一句,无奈不能上传视频,效果不明显。
用到的东西呢
主要的是利用百度API
首先呢,需要拥有一个百度账号,登录百度智能云:https://ai.baidu.com/tech/speech,然后建立一个语音识别的应用。会得到ID\APIKEY\SecretKey
在这里插入图片描述
其中可以用两种方式调用:
可以下载使用SDK
不下载使用SDK:根据文档组装url获取token,处理本地音频以JSON格式POST到百度语音识别服务器,获得返回结果

#百度语音
APP_ID = 'xxxxxxx'
base_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
APIKey = "xxxxxxxxx"
SecretKey = "xxxxxxxxxxxx"
client = AipSpeech(APP_ID, APIKey, SecretKey)
HOST = base_url % (APIKey, SecretKey)
#获取token
def getToken(host):
    res = requests.post(host)
    return res.json()['access_token']

录音及识别相关函数

#保存语音文件
def save_wave_file(filepath, data):
    wf = wave.open(filepath, 'wb'
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值