HTML是一种标识语音,HTML实现网页端语音输入（语音识别，语义理解，olami）

最新推荐文章于 2024-04-25 15:13:31 发布

胡钥

最新推荐文章于 2024-04-25 15:13:31 发布

阅读量1.5k

点赞数 1

文章标签： HTML是一种标识语音

olami开放平台sdk除了支持语音识别功能外，更强大的在于支持语义理解功能，在Android平台和iOS平台都有示例demo供大家下载。

在web端，基于JavaScript用olami开放平台sdk也可以实现语音识别语义理解。本文就实现了这样一个小程序，web客户端本地用麦克风录音，录音的数据用speex压缩，然后跨域向服务器发送请求，返回识别的语音和语义字符串并显示。

先上图：

如下图刚载入的时候，未录音前界面

点击开始录音button后

一句话说完自动检测尾音结束标志然后压缩上传给服务器进行识别

将从服务器获取的识别结果显示到界面上

本例中说的语音是：“我要听三国演义这本书”，用的是android平台听书app建立的语法。返回的json字串如下：

{

“data”: {

“asr”: {

“result”:“我要听三国演义这本书”,

“speech_status”: 0,

“final”: true,

“status”: 0

},

“nli”: [

{

“desc_obj”: {

“result”:“正在努力搜索中，请稍等”,

“status”: 0

},

“semantic”: [

{

“app”: “musiccontrol”,

“input”:“我要听三国演义这本书”,

“slots”: [

{

“name”: “songname”,

“value”:“三国演义”

}

],

“modifier”

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
HTML是一种标识语音,HTML实现网页端语音输入（语音识别，语义理解，olami）

olami开放平台sdk除了支持语音识别功能外，更强大的在于支持语义理解功能，在Android平台和iOS平台都有示例demo供大家下载。在web端，基于JavaScript用olami开放平台sdk也可以实现语音识别语义理解。本文就实现了这样一个小程序，web客户端本地用麦克风录音，录音的数据用speex压缩，然后跨域向服务器发送请求，返回识别的语音和语义字符串并显示。先上图：如下图刚载入的时候...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。