最近新系统上线,刷缓存刷个不停,
准备利用语音完成此操作,解放双手,不知道能不能实现,先一点点来。。
实现步骤拆分:
1、语音识别(百度语音识别api)
2、识别后操作前台实现刷新缓存
3、。。。
想要调用百度的语音识别功能,需要如下步骤
1、需要先注册百度云的账号
2、在控制台中创建个应用,获取到API Key 和 Secret Key
3、根据文档中心手册,使用(speech/len方式)JSON格式POST上传本地文件到 http://vop.baidu.com/server_api 或 https://vop.baidu.com/server_api
4、根据返回查看报错或成功解析后文字
1)第一步不说
2)第二步完成如图
3)json 参数
JSON方式上传
语音数据和其他参数通过标准 JSON 格式串行化 POST 上传, JSON 里包括的参数:
字段名可需描述
format
必填
语音文件的格式,pcm 或者 wav 或者 amr。不区分大小写。推荐pcm文件
rate
必填
采样率,16000,固定值
channel
必填
声道数,仅支持单声道,请填写固定值 1
cuid
必填
用户唯一标识,用来区分用户,计算UV值。建议填写能区分用户的机器 MAC 地址或 IMEI 码,长度为60字符以内。
token
必填
开放平台获取到的开发者[access_token]获取 Access Token "access_token")
dev_pid
选填
不填写lan参数生效,都不填写,默认1537(普通话 输入法模型),dev_pid参数见本节开头的表格
lan
选填,废弃参数
历史兼容参数,请使用dev_pid。如果dev_pid填写,该参数会被覆盖。语种选择,输入法模型,默认中文(zh)。 中文=zh、粤语=ct、英文=en,不区分大小写。
url
选填
可下载的语音下载地址,与callback连一起使用,确保百度服务器可以访问。
callback
选填
用户服务器的识别结果回调地址,确保百度服务器可以访问
speech
选填
本地语音文件的的二进制语音数据 ,需要进行base64 编码。与len参数连一起使用。
len
选填
本地语音文件的的字节数,单位字节
样例:
{
"format":"pcm",
"