uniapp 语音播报的功能_【走近AI】浅谈语音UI导航的基本原理。

语音U I导航,利用语音进行系统交互操作。识别客户的语音内容,翻译出需要的指令,根据指令给出系统反馈结果,并进行播报。同时,可以通过声纹识别进行鉴权

定语音唤醒词等功能。实现“解放你的双手,用声音控制页面”的目标。

一直以来,用户与系统的交互以视觉界面交互为主,期望用户在视觉界面上完成他们的需求,而这需要用户将全部注意力都集中在界面上,用户需要专注于界面的交互体验。

随着语音交互的体验设计研究开始兴起。智能手机、智能汽车等应用开始研究和应用语音交互的模式。这些都证明了企业和市场对于语音交互潜在优势的认同。语音交互开始逐渐进入到我们的视野,如下图。

e61ce3a2512fa3829993f28a093b3109.png

具体的语音导航的功能架构如下图。

3ca057db38b081d5dc1282fe586a064f.png

语音导航要结合业务知识库读懂业务意识,结合语言知识库读懂语言的含义。然后通过语音的采集、上下文分析等功能,判断语音的实际含义。再据此支撑语音唤醒、语音查询等具体操作。该系统要实现统一应用注册管理、场景管理、业务系统语音控制指令集管理。建立集中统一的语音智能控制接入服务。

1、具体操作过程如下:

(1)通过唤醒关键词激活应用:定义唤醒特定指令,唤醒词如“快乐平安”。

(2)声纹认证方面,参见后续的声纹识别原理。

(3)语音识别包括听写转换、分词处理、语义/情感分析、自然语言处理,以及基于规则匹配的业务平台后端处理逻辑。

(4)进行指令匹配,并执行指令动作,例如菜单或操作结果的信息交互,并进行后续操作的引导。

(5)依照指令完成控制执行,并将执行的结果反馈,结果也可以被转换成文字被语音合成播放出来,如查询指令后的查询结果。

2、功能特性

由语音代替键盘或触控输入,实现语音唤醒、声纹识别、智能搜索、语音播报、界面操作控制。能够较好地满足用户通过语音进行界面操作的需求,解放了双手。适合在用户开车时进行语音交互操作,获取结果信息。

场景举例:

用户通过语音激活应用:“快乐平安”(假设唤醒词为“快乐平安”),然后进行声纹登录;同时通过语音的信息采集,后端已经进行了登录用户身份的声纹识别,完成用户的身份认证和鉴权;搜索报表名称模糊匹配后,通过语音合成播报反馈给用户。用户可以通过语音进行报表的日期查询,进行页面跳转和按钮操作,通过语音关注(收藏)、取消关注(收藏)报表等。

7be9774c6f4f9e2a69ff32a6275309c4.png
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值