短音频识别(一句话识别)接口设计方案

 

短音频识别(一句话识别)接口设计方案

 

功能介绍

用于短语音的同步识别。一次性上传整个音频,响应中即返回识别结果。

URI

POST /v1/asr/short-audio

请求头

参数名称

类型

必须

说明

PACKAGE-NAME

string

包名

PACKAGE-SIGN

string

签名

API-KEY

string

根据包名生成的key

APP-KEY

string

app_key平台分配

 

请求示例:

{

"app_key": "10025"

    "config": {

        "encoding": "LINEAR16",

        "sampleRateHertz": 16000,

        "languageCode": "en-US",

    },

    "data": "/+MgxAAUeHpMAUkQAANhuRAC...",
"timestamp": 1231234213,
    "nonce": "acbf"
    "sig":"feafefaefaefef"

}

 

响应示例:

{

"code":"SIS.0001",

"result":{

"text": "欢迎使用语音云服务。",

"score": 0.9

},

"message":"***" 

}

 

请求消息

参数名

是否必选

参数类型

说明

app_key

String

app_key平台分配

config

Object

配置信息,请参考表 config数据结构。

data

String

语音数据,Base64编码,要求Base64编码后大小不超过4M,音频时长不超过1分钟。

timestamp

Integer

时间戳(秒)当前时间戳,5分钟后过期

nonce

String

随机字符串(4位)

sig

String

生成后的验证码

 

config数据结构

参数名

是否必选

参数类型

说明

encoding

String

支持语音的格式,请参考表encoding取值范围

sampleRateHertz

Integer

采样率,参照encoding取值范围,并根据当前音频保存格式设置。

languageCode

String

包含所提供音频的语言和区域/语言区域以用于语音识别。语言代码必须是 BCP-47 标识符

请参照支持语言列表

采样率

您可以在请求配置的sampleRateHertz字段中指定音频的采样率,并且它必须与相关音频内容或音频流的采样率相一致。支持的采样率为 8000 Hz 到 48000 Hz。FLAC或WAV文件的采样率可以根据文件头而不是sampleRateHertz字段确定。

对源素材进行编码时,如果可以选择,请使用16000Hz 的采样率采集音频。低于此值可能损害语音识别的准确性,但更高的采样率对语音识别质量并没有明显影响。

但是,如果您的音频数据已经录制完毕,但并非采用16000Hz的采样率,请勿将音频重新采样为16000Hz。例如,大多数传统电话音频使用 8000 Hz 的采样率,这可能会产生不够准确的结果。但如果您必须使用此类音频,请将其以原生采样率提供给Speech API。

encoding取值范围

encoding取值

说明

FLAC

信息流要求使用 16 位或 24 位的位深。FLAC既是一种音频编解码器,也是一种音频文件格式。如需使用FLAC编码转录音频文件,您必须提供.FLAC格式的文件,该格式带有一个包含元数据的文件头。

LINEAR16

16 位线性脉冲编码调制 (PCM) 编码

支持含有LINEAR16的WAV文件。

MULAW

8 位 PCM 编码。

支持含有MULAW的WAV文件。

AMR

采样率必须为 8000 Hz

AMR_WB

采样率必须为 16000 Hz

OGG_OPUS

采样率必须为 8000 Hz、12000 Hz、16000 Hz、24000 Hz 或 48000 Hz 之一

SPEEX_WITH_HEADER_BYTE

采样率必须为 16000 Hz

响应消息

参数名

是否必选

参数类型

说明

code

String

1000表示成功 其他表示失败 错误信息提示

message

String

返回请求信息。

result

Object

调用成功表示识别结果。请参考表 result 数据结构

 

result 数据结构

参数名

是否必选

参数类型

说明

text

String

调用成功表示识别出的内容。

score

Float

调用成功表示识别出的置信度,取值范围:0~1。

 

 

支持语言列表

语言

BCP-47

南非荷兰语(南非)

af-ZA

南非荷兰语(南非)

af-ZA

阿尔巴尼亚语(阿尔巴尼亚)

sq-AL

阿尔巴尼亚语(阿尔巴尼亚)

sq-AL

阿姆哈拉语(埃塞俄比亚)

am-ET

阿姆哈拉语(埃塞俄比亚)

am-ET

阿拉伯语(阿尔及利亚)

ar-DZ

阿拉伯语(阿尔及利亚)

ar-DZ

阿拉伯语(巴林)

ar-BH

阿拉伯语(巴林)

ar-BH

阿拉伯语(埃及)

ar-EG

阿拉伯语(埃及)

ar-EG

阿拉伯语(伊拉克)

ar-IQ

阿拉伯语(伊拉克)

ar-IQ

阿拉伯语(以色列)

ar-IL

阿拉伯语(以色列)

ar-IL

阿拉伯语(约旦)

ar-JO

阿拉伯语(约旦)

ar-JO

阿拉伯语(科威特)

ar-KW

阿拉伯语(科威特)

ar-KW

阿拉伯语(黎巴嫩)

ar-LB

阿拉伯语(黎巴嫩)

ar-LB

阿拉伯语(摩洛哥)

ar-MA

阿拉伯语(摩洛哥)

ar-MA

阿拉伯语(阿曼)

ar-OM

阿拉伯语(阿曼)

ar-OM

阿拉伯语(卡塔尔)

ar-QA

阿拉伯语(卡塔尔)

ar-QA

阿拉伯语(沙特阿拉伯)

ar-SA

阿拉伯语(沙特阿拉伯)

ar-SA

阿拉伯语(巴勒斯坦国)

ar-PS

阿拉伯语(巴勒斯坦国)

ar-PS

阿拉伯语(突尼斯)

ar-TN

阿拉伯语(突尼斯)

ar-TN

阿拉伯语(阿拉伯联合酋长国)

ar-AE

阿拉伯语(阿拉伯联合酋长国)

ar-AE

阿拉伯语(也门)

ar-YE

阿拉伯语(也门)

ar-YE

亚美尼亚语(亚美尼亚)

hy-AM

亚美尼亚语(亚美尼亚)

hy-AM

阿塞拜疆语(阿塞拜疆)

az-AZ

阿塞拜疆语(阿塞拜疆)

az-AZ

巴斯克语(西班牙)

eu-ES

巴斯克语(西班牙)

eu-ES

孟加拉语(孟加拉)

bn-BD

孟加拉语(孟加拉)

bn-BD

孟加拉语(印度)

bn-IN

孟加拉语(印度)

bn-IN

波斯尼亚语(波斯尼亚和黑塞哥维那)

bs-BA

波斯尼亚语(波斯尼亚和黑塞哥维那)

bs-BA

保加利亚语(保加利亚)

bg-BG

保加利亚语(保加利亚)

bg-BG

缅甸语(缅甸)

my-MM

缅甸语(缅甸)

my-MM

加泰罗尼亚语(西班牙)

ca-ES

加泰罗尼亚语(西班牙)

ca-ES

中文粤语(香港繁体)

yue-Hant-HK

中文粤语(香港繁体)

yue-Hant-HK

中文普通话(中国简体)

zh (cmn-Hans-CN)

中文普通话(中国简体)

zh (cmn-Hans-CN)

中文普通话(台湾繁体)

zh-TW (cmn-Hant-TW)

中文普通话(台湾繁体)

zh-TW (cmn-Hant-TW)

克罗地亚语(克罗地亚)

hr-HR

克罗地亚语(克罗地亚)

hr-HR

捷克语(捷克共和国)

cs-CZ

捷克语(捷克共和国)

cs-CZ

丹麦语(丹麦)

da-DK

丹麦语(丹麦)

da-DK

荷兰语(比利时)

nl-BE

荷兰语(比利时)

nl-BE

荷兰语(荷兰)

nl-NL

荷兰语(荷兰)

nl-NL

英语(澳大利亚)

en-AU

英语(澳大利亚)

en-AU

英语(加拿大)

en-CA

英语(加拿大)

en-CA

英语(加纳)

en-GH

英语(加纳)

en-GH

英语(香港)

en-HK

英语(香港)

en-HK

英语(印度)

en-IN

英语(印度)

en-IN

英语(爱尔兰)

en-IE

英语(爱尔兰)

en-IE

英语(肯尼亚)

en-KE

英语(肯尼亚)

en-KE

英语(新西兰)

en-NZ

英语(新西兰)

en-NZ

英语(尼日利亚)

en-NG

英语(尼日利亚)

en-NG

英语(巴基斯坦)

en-PK

英语(巴基斯坦)

en-PK

英语(菲律宾)

en-PH

英语(菲律宾)

en-PH

英语(新加坡)

en-SG

英语(新加坡)

en-SG

英语(南非)

en-ZA

英语(南非)

en-ZA

英语(坦桑尼亚)

en-TZ

英语(坦桑尼亚)

en-TZ

英语(英国)

en-GB

英语(英国)

en-GB

英语(英国)

en-GB

英语(英国)

en-GB

英语(美国)

en-US

英语(美国)

en-US

英语(美国)

en-US

英语(美国)

en-US

英语(美国)

en-US

爱沙尼亚语(爱沙尼亚)

et-EE

爱沙尼亚语(爱沙尼亚)

et-EE

菲律宾语(菲律宾)

fil-PH

菲律宾语(菲律宾)

fil-PH

芬兰语(芬兰)

fi-FI

芬兰语(芬兰)

fi-FI

法语(比利时)

fr-BE

法语(比利时)

fr-BE

法语(加拿大)

fr-CA

法语(加拿大)

fr-CA

法语(法国)

fr-FR

法语(法国)

fr-FR

法语(瑞士)

fr-CH

法语(瑞士)

fr-CH

加利西亚语(西班牙)

gl-ES

加利西亚语(西班牙)

gl-ES

格鲁吉亚语(格鲁吉亚)

ka-GE

格鲁吉亚语(格鲁吉亚)

ka-GE

德语(奥地利)

de-AT

德语(奥地利)

de-AT

德语(德国)

de-DE

德语(德国)

de-DE

德语(瑞士)

de-CH

德语(瑞士)

de-CH

希腊语(希腊)

el-GR

希腊语(希腊)

el-GR

古吉拉特语(印度)

gu-IN

古吉拉特语(印度)

gu-IN

希伯来语(以色列)

iw-IL

希伯来语(以色列)

iw-IL

印地语(印度)

hi-IN

印地语(印度)

hi-IN

匈牙利语(匈牙利)

hu-HU

匈牙利语(匈牙利)

hu-HU

冰岛语(冰岛)

is-IS

冰岛语(冰岛)

is-IS

印度尼西亚语(印度尼西亚)

id-ID

印度尼西亚语(印度尼西亚)

id-ID

意大利语(意大利)

it-IT

意大利语(意大利)

it-IT

意大利语(瑞士)

it-CH

意大利语(瑞士)

it-CH

日语(日本)

ja-JP

日语(日本)

ja-JP

爪哇语(印度尼西亚)

jv-ID

爪哇语(印度尼西亚)

jv-ID

卡纳达语(印度)

kn-IN

卡纳达语(印度)

kn-IN

高棉语(柬埔寨)

km-KH

高棉语(柬埔寨)

km-KH

韩语(韩国)

ko-KR

韩语(韩国)

ko-KR

老挝语(老挝)

lo-LA

老挝语(老挝)

lo-LA

拉脱维亚语(拉脱维亚)

lv-LV

拉脱维亚语(拉脱维亚)

lv-LV

立陶宛语(立陶宛)

lt-LT

立陶宛语(立陶宛)

lt-LT

马其顿语(北马其顿)

mk-MK

马其顿语(北马其顿)

mk-MK

马来语(马来西亚)

ms-MY

马来语(马来西亚)

ms-MY

马拉雅拉姆语(印度)

ml-IN

马拉雅拉姆语(印度)

ml-IN

马拉地语(印度)

mr-IN

马拉地语(印度)

mr-IN

蒙古语(蒙古)

mn-MN

蒙古语(蒙古)

mn-MN

尼泊尔语(尼泊尔)

ne-NP

尼泊尔语(尼泊尔)

ne-NP

博克马尔挪威语(挪威)

no-NO

博克马尔挪威语(挪威)

no-NO

波斯语(伊朗)

fa-IR

波斯语(伊朗)

fa-IR

波兰语(波兰)

pl-PL

波兰语(波兰)

pl-PL

葡萄牙语(巴西)

pt-BR

葡萄牙语(巴西)

pt-BR

葡萄牙语(葡萄牙)

pt-PT

葡萄牙语(葡萄牙)

pt-PT

旁遮普语(果鲁穆奇语,印度)

pa-Guru-IN

旁遮普语(果鲁穆奇语,印度)

pa-Guru-IN

罗马尼亚语(罗马尼亚)

ro-RO

罗马尼亚语(罗马尼亚)

ro-RO

俄语(俄罗斯)

ru-RU

俄语(俄罗斯)

ru-RU

俄语(俄罗斯)

ru-RU

俄语(俄罗斯)

ru-RU

塞尔维亚语(塞尔维亚)

sr-RS

塞尔维亚语(塞尔维亚)

sr-RS

僧伽罗语(斯里兰卡)

si-LK

僧伽罗语(斯里兰卡)

si-LK

斯洛伐克语(斯洛伐克)

sk-SK

斯洛伐克语(斯洛伐克)

sk-SK

斯洛文尼亚语(斯洛文尼亚)

sl-SI

斯洛文尼亚语(斯洛文尼亚)

sl-SI

西班牙语(阿根廷)

es-AR

西班牙语(阿根廷)

es-AR

西班牙语(玻利维亚)

es-BO

西班牙语(玻利维亚)

es-BO

西班牙语(智利)

es-CL

西班牙语(智利)

es-CL

西班牙语(哥伦比亚)

es-CO

西班牙语(哥伦比亚)

es-CO

西班牙语(哥斯达黎加)

es-CR

西班牙语(哥斯达黎加)

es-CR

西班牙语(多米尼加共和国)

es-DO

西班牙语(多米尼加共和国)

es-DO

西班牙语(厄瓜多尔)

es-EC

西班牙语(厄瓜多尔)

es-EC

西班牙语(萨尔瓦多)

es-SV

西班牙语(萨尔瓦多)

es-SV

西班牙语(危地马拉)

es-GT

西班牙语(危地马拉)

es-GT

西班牙语(洪都拉斯)

es-HN

西班牙语(洪都拉斯)

es-HN

西班牙语(墨西哥)

es-MX

西班牙语(墨西哥)

es-MX

西班牙语(尼加拉瓜)

es-NI

西班牙语(尼加拉瓜)

es-NI

西班牙语(巴拿马)

es-PA

西班牙语(巴拿马)

es-PA

西班牙语(巴拉圭)

es-PY

西班牙语(巴拉圭)

es-PY

西班牙语(秘鲁)

es-PE

西班牙语(秘鲁)

es-PE

西班牙语(波多黎各)

es-PR

西班牙语(波多黎各)

es-PR

西班牙语(西班牙)

es-ES

西班牙语(西班牙)

es-ES

西班牙语(美国)

es-US

西班牙语(美国)

es-US

西班牙语(美国)

es-US

西班牙语(美国)

es-US

西班牙语(乌拉圭)

es-UY

西班牙语(乌拉圭)

es-UY

西班牙语(委内瑞拉)

es-VE

西班牙语(委内瑞拉)

es-VE

巽他语(印度尼西亚)

su-ID

巽他语(印度尼西亚)

su-ID

斯瓦希里语(肯尼亚)

sw-KE

斯瓦希里语(肯尼亚)

sw-KE

斯瓦希里语(坦桑尼亚)

sw-TZ

斯瓦希里语(坦桑尼亚)

sw-TZ

瑞典语(瑞典)

sv-SE

瑞典语(瑞典)

sv-SE

泰米尔语(印度)

ta-IN

泰米尔语(印度)

ta-IN

泰米尔语(马来西亚)

ta-MY

泰米尔语(马来西亚)

ta-MY

泰米尔语(新加坡)

ta-SG

泰米尔语(新加坡)

ta-SG

泰米尔语(斯里兰卡)

ta-LK

泰米尔语(斯里兰卡)

ta-LK

泰卢固语(印度)

te-IN

泰卢固语(印度)

te-IN

泰语(泰国)

th-TH

泰语(泰国)

th-TH

土耳其语(土耳其)

tr-TR

土耳其语(土耳其)

tr-TR

乌克兰语(乌克兰)

uk-UA

乌克兰语(乌克兰)

uk-UA

乌尔都语(印度)

ur-IN

乌尔都语(印度)

ur-IN

乌尔都语(巴基斯坦)

ur-PK

乌尔都语(巴基斯坦)

ur-PK

乌兹别克语(乌兹别克斯坦)

uz-UZ

乌兹别克语(乌兹别克斯坦)

uz-UZ

越南语(越南)

vi-VN

越南语(越南)

vi-VN

祖鲁语(南非)

zu-ZA

祖鲁语(南非)

zu-ZA

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值