声纹识别
一、接口描述
1. 功能描述
声纹识别基于说话人的声音提供说话人确认功能。
2. 能力说明
声纹识别API提供说话人注册以及说话人确认的功能。用户可以先用声音进行注册,再根据声音进行说话人确认。
3. 音频要求
目前支持的音频格式为:wav、mp3、amr
音频采样率为:16 KHz
音频通道数:单通道
一次请求的音频最大时长:60 秒
4. 接口使用
平台为每个 API 提供试用体验服务,您在 AI 市场选择“免费试用”规格下单后,即可开始体验业内领先的人工智能 API 服务。
免费试用服务具有调用量、QPS 限制,如需更高性能的 API 服务,可以提交咨询工单,联系京东 AI 扩容购买。
在获得使用权限后,您可使用已经封装好的 SDK 参照 接口鉴权 规则进行相应开发,整体流程详见 接入流程 。
二、请求说明
1. 接口地址
https://aiapi.jd.com/jdai/vpr
2. 请求方式
post
3. 请求参数
(1)query 请求参数
公共请求参数
名称
类型
必填
示例值
描述
appkey
string
是
80d2b762ecb86593f9668526920f46c
您的 appkey,可在买家中心控制台中获取
timestamp
long
是
1541491668060
请求的时间戳,精确到毫秒,timestamp 有效期 5 分钟
sign
string
是
2e148773a0337a8f2200ba90d445f083
签名,根据规则MD5(secretkey + timestamp)
(2)header 请求参数
业务请求参数
名称
类型
必填
示例值
描述
Content-Type
string
是
application/octet-stream
内容类型:
不可用的Content-Type:
- multipart/form-data
- application/x-www-form-urlencoded
Application-Id
string
否
your Application-Id
产品 ID:
- 业务方应用名称,由业务方在客户端自行生成
Request-Id
string
是
*56a847e6-84c0-4c01-bf4b-d566f2d2dd11
请求ID:
- *注意:示例值仅供参考,正式使用请务必通过 uuid 生成
- 对于同一次请求 Request-Id 需要保持一致,多次请求使用同一个将会产生不可预知的错误
User-Id
string
是
IMEI-12345678
用户ID:
- *注意:示例值仅供参考
- 用户id是某一个人唯一的身份id
Sequence-Id
int
是
-1
语音传输分段号:
- 从 1 开始依次递增,最后一段语音取负值,分为下述两种情况:
1. 在一个 Request-Id 中,上传整个音频文件(整包请求)时:填 -1
2. 在一个 Request-Id 中,音频文件分段上传(流式分包请求)时,遵循默认规则依次递增。例如:一次语音识别请求中,音频分 10 次上传,则 Sequence-Id 依次为:1,2,3,4,5,6,7,8,9,-10
Server-Protocol
int
是
1