HTML是一种标识语音,HTML实现网页端语音输入(语音识别,语义理解,olami)

olami开放平台sdk除了支持语音识别功能外,更强大的在于支持语义理解功能,在Android平台和iOS平台都有示例demo供大家下载。

在web端,基于JavaScript用olami开放平台sdk也可以实现语音识别语义理解。本文就实现了这样一个小程序,web客户端本地用麦克风录音,录音的数据用speex压缩,然后跨域向服务器发送请求,返回识别的语音和语义字符串并显示。

先上图:

如下图刚载入的时候,未录音前界面

7ad88e851ea781a890e4aa44c6ae2f6c.png

点击开始录音button后

43a17ec57b48f28645e3559c5a12af86.png

一句话说完自动检测尾音结束标志然后压缩上传给服务器进行识别

5fbe7d3cc4e0e2b1a38ea868a74993a1.png

将从服务器获取的识别结果显示到界面上

0bdd174f6701dd670177934045c389e6.png

本例中说的语音是:“我要听三国演义这本书”,用的是android平台听书app建立的语法。返回的json字串如下:

{

“data”: {

“asr”: {

“result”:“我要听三国演义这本书”,

“speech_status”: 0,

“final”: true,

“status”: 0

},

“nli”: [

{

“desc_obj”: {

“result”:“正在努力搜索中,请稍等”,

“status”: 0

},

“semantic”: [

{

“app”: “musiccontrol”,

“input”:“我要听三国演义这本书”,

“slots”: [

{

“name”: “songname”,

“value”:“三国演义”

}

],

“modifier”

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值