智能语音技术

智能语音技术是最早落地的人工智能技术,也是市场上众多人工智能产品中应用最为广泛的。

机器交互的发展过程: 命令行界面(CLI) -> 图形用户界面(GUI) -> 自然用户界面(NUI)

语音交互界面(Voice User Interface,VUI)就是NUI最重要的一种。

 

常见的语音交互场景

  1. 手机/pc的语音助手 Siri、Google Assistant、Cortana、Bixby等等
  2. 自动化客服(在线客服、电话客服)
  3. 车载语音控制系统
  4. 智能音响、电视、开关、扫地机、家教机、电视盒子 等家庭电子产品
  5. 智能穿戴设备
  6. 服务行业交互机器人
  7. 其他场景如:医疗场景病历录入、教育场景的语音平板、地图导航

 

智能语音发展的几个阶段

技术萌芽阶段:

1952年,第一个语音识别系统Audry诞生

技术突破阶段:

1984年计算机第一次开口说话,IBM发布的语音识别系统在5000个词汇量级上达到了95%的识别率

1988年,世界上首个非特定人大词汇量连续语音识别系统SPHINX诞生

产业化阶段:

1997年,语音听写产品问世。次年,可识别上海话、广东话和四川话等地方口音的语音识别系统被成功开发

2002年,美国首先启动了“全球自主语言开发”项目

2009年,微软Win7集成语音功能

快速应用阶段:

2011年,苹果个人手机助理Siri诞生

2015年,首个可智能打断纠正的语音技术问世

2017年,智能语音系统集中扩展深度学习应用技术终于取得了突破性进展

 

智能语音交互系统模型及发展

 

  • 语音识别(Automatic Speech Recognition):简称ASR,是将声音转化成文字的过程。
  • 自然语言处理(Natural Language Processing):简称NLP,是理解和处理文本的过程。
  • 语音合成(Text-To-Speech):简称TTS,是把文本转化成语音的过程。

 

 

不断满足人的体验的人机语音交互系统

 

我们不难发现其实国内做语音唤醒、语音识别、语音合成很多,其实并不是人机交互的难点

而重要的是语音理解,是要能根据已有的数据进行语音理解,理解用户的这句话的对话意图,

从而给出对应的操作。

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值