腾讯语音识别 php接口,文档中心

常见问题

基础技术

Q:什么是字典升序排序?

A:字典升序排序是一种关联数组排序方式,开发者可参考PHP中的ksort内置函数实现。

例如:以PHP为例,假设关联数组如下。

$list = array(

'aaa' => 'aaa',

'abc' => 'abc',

'abb' => 'abb',

'1aa' => '1aa',

'abd' => 'abd'

);

那么字典升序排序结果如下(使用ksort实现)。

$list = array(

'1aa' => '1aa',

'aaa' => 'aaa',

'abb' => 'abb',

'abc' => 'abc',

'abd' => 'abd'

);

Q:什么是base64编码?平台什么限制?

A:base64编码是一种基于64个可打印字符对二进制数据进行编码存储的方式,方便在HTTP请求/响应正文中以明文字符串形式传输图片、语音等类型数据(二进制数据)。

base64编码存在多个变种实现,请开发者注意以下细节。

编码结果只会包含大小写字母、数字、+、/共64种可打印字符,不会包含回车、换行等特殊控制字符

对于图片base64编码,编码结果不包含图片头data:image/jpg;base64,

Q:base64编码有哪些参考实现?怎么判断我的base64编码是正确的?

A:标准base64可参考wiki文档实现。对于使用PHP语言的开发者,可以直接使用base64_encode/base64_decode内置函数实现。

判断base64是否符合要求,可以参考下述2种方式进行。

对比PHP的base64_encode内置函数的输出结果,如果一致,说明是正确的。

// 输出/path/to/data文件的base64编码结果

$data = file_get_contents('/path/to/data');

echo base64_encode($data);

?>

对比Linux的base64内置工具的输出结果,如果一致,说明是正确的。

$ ## 输出/path/to/data的base64编码结果

$ base64 -w0 /path/to/data

Q:什么是URL编码?平台什么限制?

A:URL编码是一种基于百分号编码对HTTP非保留字符数据进行编码的方式,保证HTTP请求/响应报文的合法性(能够正常解析)。

URL编码存在多个变种实现,请开发者注意以下细节。

保留编码的字符: -、.、_、数字、大小写字母(这些字符在URL编码结果后不会变化)

特殊编码的字符:空格(这个字符在URL编码后变成+符号)

其他字符:除了保留编码和特殊编码之外的字符(含多字节字符),一律使用%XX方式(百分号)编码,其中XX是该字符(每个字节值)的十六进制字母表示,字母一律使用大写形式。例如:GBK编码的腾讯共有2个字符,每个字符由2个字节组成,十六进制分别为:腾 => 0xCCDA、讯 => 0xD1B6,那么腾讯的URL编码是:%CC%DA%D1%B6。

URL编码受字符编码影响,即不同字符编码的字符串,在URL编码后得到的结果也不一样(具体编码方式请以具体接口要求为准)。例如:GBK编码的腾讯的URL编码结果是:%CC%DA%D1%B6,而UTF-8编码的腾讯的URL编码结果是:%E8%85%BE%E8%AE%AF。

对于使用PHP语言的开发者,可以直接使用urlencode内置函数实现。

接口鉴权

Q:接口返回4096是为什么?

A:参考返回码可以发现4096是服务器发现请求参数不合法或者不存在。请开发者参考具体的接口请求参数约束条件进行自检。

若所有参数均符合要求,则请开发者检查API调用方式是否正常。

对于POST方式请求,检查HTTP请求头的Content-Type是否为application/x-www-form-urlencoded

对于POST方式请求,检查HTTP请求正文数据是否符合application/x-www-form-urlencoded协议要求(注意:请求正文不是一个JSON结构,而是URL键值对字符串)

Q:接口返回16388是为什么?

A:参考返回码可以发现16388是服务器检查请求签名时,发现签名不正确。请开发者参考接口鉴权的示例代码进行检查。

Q:出现签名不正确的原因可能有哪些?

A:一般情况下,出现签名不正确的原因可能包含但不限于以下情况。

设置计算签名的参数对有误(注意:每个接口的参数列表不一样,用于计算签名的参数列表也不一样)

没有正确按字典升序对参与签名的参数对进行排序,导致拼接URL键值对字符串有误

拼接URL键值对时,未对value部分进行URL编码

URL编码中,”%“后面两个字母为小写,但服务器要求大写形式(例如%2f是非法的,而%2F才是合法的)

URL编码实现不一致,例如空格符号编码成了"%20",但服务器实现是编码成"+"(可参考PHP的urlencode()函数实现其他语言的版本)

请求API时,发出的HTTP BODY中,所有参数都经过了二次urlencode(部分语言的http工具包会自动完成请求时所有参数的urlencode过程)

对于图片数据,在将图片进行base64编码时,未采用标准base64实现(编码结果仅由大小写字母、数字、+、/符号组成,不含回车换行符号,不含图片头data:image/jpg;base64,)

Q:接口返回16390是为什么?

A:参考返回码可以发现16390是服务器检查请求签名已过期。

目前请求签名只有5分钟的有效期(通过请求数据中的time_stamp参数与服务器时间进行对比),开发者需要在每次请求API时,实时获取请求时刻的时间戳(精确到秒),以及实时计算请求签名即可避免出现该错误。

基本文本分析

Q:接口返回数据乱码是为什么?

A:基本文本分析包含分词、词性标注、专有名词识别、同义词识别共4个接口,这4个接口均要求请求/响应数据使用GBK编码,请开发者注意。

如果开发者应用中使用了UTF-8编码,那么需要在调用上述API之前,将待处理文本转换成GBK编码,并在收到API响应结果后,将整个结果转回UTF-8编码,最后进行JSON解析,得到UTF-8编码的处理结果。

语音翻译

Q:为什么返回的结果是错乱的?

A:语音翻译的语音数据必须符合16k或8K采样率、16bit采样位数、单声道,否则不保证识别效果。

智能闲聊

Q:session是什么,如何设定?

A:session表示一个闲聊会话,用于维护一个闲聊对话过程中的上下文,实现每个用户的闲聊过程是相互独立的。

建议开发者以用户纬度生成session,分配一个应用内全局唯一的标识,保证闲聊效果。当用户发起一个新的闲聊会话时,可以分配新的session。

语音识别

Q:为什么返回的结果错乱或者不正确?

A:遇到这种情况时,请开发者优先按下述方式自检。

检查语音数据是否与请求数据一致(例如语音数据实际是8k/AMR,但请求数据却是16k/WAV,这种情况会导致无法正确识别)

检查语音数据是否经过多次urlencode,这种情况会导致识别不正确

检查语音数据是否单声道录制(目前不支持双声道语音)

ORC识别

Q:能否批量识别车牌号或者营业执照?

A:目前只能单张图进行识别,单个接口只能串行不能同时并行批量识别。

Q:为什么图片识别的结果不是很准确?

A:请开发者优先按下述方式自检。

图片必须清晰,采样的图片尽量对正对齐,不要有大量的阴影和色块,及反光的情况

识别一系列证件时请只将证件信息进行采样,如有其它文字信息随同证件一起采样,识别会产生误差

图片标签识别

Q:能否批量识别图片?

A:目前接口一次只处理一张图片,批量识别需求请通过多次调用接口实现。

图片特效

Q:人脸识别的自建模板的水印可去除吗?

A:自建模板会在左下角有天天P图的水印,且水印对于所有开发者是不可去除的。

Q:人脸融合想上传更多自建模板怎么办?

A:每个应用可以自建10个模板,模板可根据开发者的选择进行删除或添加,如有更多的模板数量需求,可通过创建新应用实现。

Q:开发者自己的应用或者小程序里面能够使用平台的人脸模板做展示吗?

A:开发者的应用场景当中不能出现与平台相同的人脸展示模板。

Q:上传的素材模板图片当中融合的结果很不好,这是为什么?

A:提交的素材模板当中不要出现两张人脸,只能存在一张人脸,否则不能保证融合效果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
腾讯是一家著名的中国科技公司,旗下拥有许多热门的产品和服务,其中之一就是UE腾讯语音识别。UE是腾讯云音视频通信中一个重要的技术组件,专门用于实现语音识别和语音转写的功能。 UE腾讯语音识别是一种人工智能技术,它可以将人们的语音转化为文字。这项技术可以应用于多种场景,比如语音助手、语音翻译、语音搜索等。无论是在手机应用程序、智能音箱还是其他设备上,用户只需简单地通过语音讲话,UE腾讯语音识别就能够快速准确地将语音内容转化为文字。 UE腾讯语音识别具有高准确性和稳定性的特点。它能够识别包括普通话、粤语、英语等多种语言,并且可以适应各种不同的口音和方言。另外,UE腾讯语音识别还支持实时语音流的识别,用户可以在连续说话的过程中,实时获取文字转写结果。 腾讯作为中国最领先的科技公司之一,致力于为用户提供优质的技术和服务。UE腾讯语音识别的推出,大大方便了人们的生活和工作。通过语音输入替代传统的键盘输入,用户能够更加便捷地与设备进行交互,提升了用户体验。 总之,UE腾讯语音识别是腾讯公司提供的一项先进技术,具有高准确性、稳定性和适应性。它为用户提供了简单、快捷、智能的语音输入方式,将进一步推动人机交互技术的发展,助力更多领域的创新应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值