百度语音识别REST API——通过使用Http网络请求方式获得语音识别功能

原创 2014年06月19日 13:59:31


百度语音识别通过REST API的方式给开发者提供一个通用的HTTP接口,基于该接口,开发者可以轻松的获取语音识别能力,本文档描述了使用语音识别服务REST API的方法。

优点:

较之开发者常用的获取语音识别功能的方法,本方法最大的优势是轻量级,不需要在所开发的应用中集成任何SDK开发工具包,也不需要在测试机中添加任何识别引擎软件,开发者只要了解Http网络请求以及百度语音识别 REST API的使用规则,即可轻轻松松在自己的应用中使用语音识别相关的功能了。

功能介绍:

REST API支持整段录音文件的识别,对录音格式有一定的要求,支持语音识别控件:集成提示音、音量反馈动效整套交互的对话框控件,方便开发者快速集成;

原始PCM的录音参数必须符合8k/16k采样率、16bit位深、单声道,支持的压缩格式有:pcm(不压缩)、wav、opus、speex、amr、x-flac。

使用方法:

注册开放平台及创新应用

注册方法可参见之前写的百度语音识别开放平台SDK使用方法一文,其中有详细的注册方法叙述。

从管理控制台进入创建的应用,如下图所示,API Key(client_id)和Secret Key(client_secret)即显示于其中, ID即为应用id(appid)。

根据百度OAuth的Client Credentials授权方式获取access_token。百度OAuth的Client Credentials和其他授权方式的说明见百度OAuth介绍的“百度支持的OAuth授权”部分。


其中,grant_type的值固定为client_credentials,client_id即为(3)中截图所示的 API Key的值,client_secret即为截图所示的Secret Key的值。更为详细的介绍请参见Client Credentials授权说明。
响应如下所示,其中access_token字段即为请求REST API所需的令牌, access_token有效期一般为一个月,开发者需要对access_token,进行有效性判断,过期需重新申请access_token。



API请求方式

 语音识别接口支持POST 方式
 目前API仅支持整段语音识别的模式,即需要上传整段语音进行识别
 语音数据上传方式有两种:隐示发送和显示发送
 原始语音的录音格式目前只支持评测8k/16k采样率16bit位深的单声道语音
 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr、x-flac
 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)
 正式地址:http://vop.baidu.com/server_api

语音上传模型

语音数据和其他参数通过标准JSON格式串行化POST上传, JSON里包括的参数:




其中,开发者可以把语音数据放在JSON序列的“speech”字段中,需要将语音先进行base64编码,并标明语音数据的原始长度,填写“len”字段;也可以直接提供语音下载地址放在“url”字段中,并且提供识别结果的回调地址,放在“callback”参数中。因此“speech”和“len”参数绑定,“url”和“callback”参数绑定,这张组参数二选一填写,如果都填,默认处理第一种。


表单类型在HTTP-HEADER里的content-type表明,例:


Content-length请填写JSON串的长度。
 上传实例:


 注意事项:
1, len字段表示原始语音长度,不是base64编码之后的长度。
2, speech和len字段绑定验证,url和callback绑定验证,两组参数二选一必填,如果都填,默认第一种方式。
3, 如果采用base64编码语音数据,数据量会增大1/3。
 显示发送:
语音数据直接放在HTTP-BODY中,控制参数以及相关统计信息通过REST参数传递,REST参数说明:



语音数据的采样率和压缩格式在HTTP-HEADER里的content-type表明,例:


Content-length请填写原始语音长度。
 URL示例:


下行接口定义

两种上传方式都返回统一的结果,采用 JSON格式封装,如果识别成功,识别结果放在JSON的“result”字段中,统一采用utf-8方式编码。


 识别成功返回case:
{\"err_no\":0,\"err_msg\":\"success.\",\"corpus_no\":\"15984125203285346378\",\"sn\":\"481D633F-73BA-726F-49EF-8659ACCC2F3D\",\"result\":[\"\\u6211\\u633a\\u5e05\\u554a\\uff0c\\u5e05\\u54e5\\uff0c\"]}
 识别错误返回case:
{"err_no":2000,"err_msg":"data empty.","sn":null}

错误码解释
33xx:系统内部模块交互错误,服务此时可能不太稳定。
34xx:参数错误,请检查上行参数。
30xx-32xx:后端错误,后端资源可能出现错误


由于篇幅所限,具体使用方法在下篇文章介绍。

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zpf8861/article/details/32322089

百度语音识别服务 —— 语音识别 REST API 开发笔记

在以前的项目中用到了百度语音识别服务,在这里做一个笔记。这里还是要和大家强调一下,最好的学习资料就是官网网站。我这里只是一个笔记,一方面整理了思路,另一方面方便以后我再次用到的时候可以快速回忆起来。百...
  • lw_power
  • lw_power
  • 2016-06-27 21:00:59
  • 11518

restTemplate上传文件.整个body里面只放文件流

HttpHeaders headers = new HttpHeaders(); headers.setContentType(MediaType.APPLICATION_OC...
  • caodanwang2011
  • caodanwang2011
  • 2017-07-20 11:00:56
  • 1623

REST实战——调用百度语音的云服务

RESTful REST(REpresentation State Transfer)描述了一个架构样式的网络系统,比如说web应用程序。它首次出现在2000年Roy Thomas Fielding的...
  • u011000290
  • u011000290
  • 2016-04-19 13:31:34
  • 7006

百度语音识别api调用 python

最近在处理语音检索相关的事。 其中用到语音识别,调用的是讯飞与百度的api,前者使用js是实现,后者用python3实现(因为自己使用python)环境:python3.5 centos 7流程整...
  • a1368783069
  • a1368783069
  • 2017-02-23 10:34:03
  • 2548

调用百度语音合成朗读中英文示例,Delphi2010下编译通过

  • 2018年04月13日 17:46
  • 728KB
  • 下载

调用百度API实现简单的文字识别

偷懒是学习的动力。最近上的课程多数是英文的材料,而且还是图片,对于我这种英语恐惧症的人而言就是噩梦,unfriendly!!!!于是发现了百度的api–OCR 具体细节请看API文档:http://a...
  • qq_14998713
  • qq_14998713
  • 2017-11-30 20:20:55
  • 3588

Java 调用Restful API接口的几种方式--HTTPS

摘要:最近有一个需求,为客户提供一些Restful API 接口,QA使用postman进行测试,但是postman的测试接口与java调用的相似但并不相同,于是想自己写一个程序去测试Restful ...
  • zpf336
  • zpf336
  • 2017-06-20 10:29:37
  • 16520

百度语音识别开放平台SDK使用方法

本文介绍了百度语音识别sdk简单的集成方法
  • zpf8861
  • zpf8861
  • 2014-06-12 11:25:36
  • 14378

使用URL在线语音合成

最近一直在做手机的项目,用到了语音合成与识别的功能,就找了几个网址做了分析,这里仅仅实现了内容的合成,并不包括语音识别。首先看一下谷歌的语音合成地址:http://translate.google.c...
  • w_yunlong
  • w_yunlong
  • 2015-12-29 11:57:17
  • 2700

php 百度语音识别 REST API demo

1,首先打开百度语音识别官网,注册一个账户成为开发者,接着创建一个应用,下载百度提供源代码 。下载地址: http://yuyin.baidu.com/sdk/ 官方文档地址:http://yuy...
  • weixin_36429334
  • weixin_36429334
  • 2016-12-27 11:04:56
  • 3516
收藏助手
不良信息举报
您举报文章:百度语音识别REST API——通过使用Http网络请求方式获得语音识别功能
举报原因:
原因补充:

(最多只允许输入30个字)