阿里智能语音平台助力人机交互

摘要:在云栖大会上,天猫精灵幕后团队——人工智能实验室的聂再清为大家介绍了语音交互平台的运作机理和完善方法。在智能化普及程度逐渐加深的当代,人机交互也就成为了丞待解决的问题。为了解决这一难题,阿里巴巴的人工智能实验室对智能语音交互平台进行了深入研究和全面优化。

01

以下为精彩视频内容整理:
优化人机交互下阶段的目标

人机交互平台的发展经历了字符阶段、图像阶段、触屏阶段,而触屏阶段的普及在带来便利的同时营业产生了诸多不便,“低头族”的产生便是最好的证明。人类的需求是永不止步的,需要将人的眼睛拘束于操作界面的便利已不再是便利。语音操作系统可以让人们通过简单的发出指令来获取贴心的服务,使人们不再需要投入眼力和手力,所以智能语音交互平台的普及是必然的。

NR__57C8U_C86P6T_7HX

想要使智能语音交互平台更加地贴心,首先要解决的便是要让其拥有正确的理解能力,人工智能团队意识到了这个问题,并制定出了详细的计划。他们认为,革新人机交互方式是解决问题的有效途径。智能语音交互平台不仅仅需要计算能力,同时也需要知识、推理能力、行动能力、感知能力、甚至认知能力。使天猫精灵的智能语音交互平台拥有这些能力,便是人工智能实验室日后努力达成的目标。

需要解决的具体问题

天猫精灵的语音交互平台,作为行业的代表,已拥有许多贴心的功能来满足大众日常需求,而在满足大众需求的过程中,也发现了一些具体问题:

  1. 智能语音交互平台的推广需要各行各业的努力与合作。要想使智能语音交互平台更加深入大众的生活,为大家带来便利,就必须要做到生活中各个地方都可以运用它。例如点外卖就需要订餐软件或餐厅的合作,预订飞机票就需要旅游软件或航空公司的合作,查询天气就需要气象部门的合作等等。所以想要完善语音交互平台的功能,就必须获得各行各业的支持,这便是需要解决的问题之一。
  2. 语音交互的安全问题。例如当使用天猫精灵的客户需要完成支付口令时,由此带来的安全问题也是需要解决的。不能单纯地通过语音的内容便提供服务,也需确保服务于正确的人。为了辨别请求服务的人,实验室特别在天猫精灵的语音交互系统里添加了声纹识别功能,以此来确保将正确的服务给予正确的人。
  3. 自然语言的理解。这个问题是关键的,聂再清介绍了详细的解决方案。意图识别是天猫精灵提供服务的关键,必须由语音交互平台完成解析使用者语音指令的主要意图之后,才能进行正确的服务。以查询天气为例,客户发出查询天气的指令并不是统一的,但其表达的目的是唯一的,就是要查询天气。

03

交互平台需要有识别多种语句的能力,提取出客户要表达的正确意思,并且准确地执行,给客户正确的回复。这其中可能需要调用第三方的API,并且定下对话策略。指令的理解难点在于人说话的多意性和歧义性,而这两个特性起因在于人日常说话是很随性的。还是以查询天气为例,可以说“明天的天气怎么样”,“我想知道明天的天气”,“明天的风大不大”等等,而这些指令的意思却是同一种,那就是查询天气。语音交互平台需要有识别一种指令多种表达的能力,也要有能区分意思相近指令区别的能力。解决这些问题的途径,就是需要添加语料,这并不简单。

4SU0_J6AHGQSZ_QM_16_D5

客户是不可控的,我们永远没法预测客户会以什么样的语言形式表达出一个指令。请专家或专业人员来解决这件事,代价是昂贵的,而问题又是必须解决的,所以提出了开发人员提供数据的解决方案,也就是自定义技能添加语料倒句和模板。具体方案为对语料等了解不深的开发人员,可以提供类似笑话集等数据;对语料略有了解的开发人员由部门提供语句,开发人员负责标注语料并添加;而关于涉及到客户隐私之类的语料不便于开发人员存储,以免泄密,所以由人工智能的记忆功能来解决。当客户的语料不明显或不存在时,平台将通过交互式构建可替换词词典和语料模板的方式,定于或发掘语料。具体来说,就是通过互联网查询指令中与网络库模板相近的语料,过滤无意义或者无用语料,提取语音不明语料并用明确的语料替代。这个操作需要建立可替代词词典并在日后的使用中逐渐完善这一词典。比如在客户使用时,提取客户语料后,将之与词典里的语料相匹配,当意义确实相同时,不但可以完成替代,还可以把客户的语料也加入词典。这种滚雪球的方式将会使词典越来越丰富,语音交互平台理解客户意思越来越准确和快速。

如何避免智能语音交互笨拙

在最后,聂再清又总结了自己对于如何避免智能语音交互笨拙的一些看法。第一是要做垂直应用,开发团队不要抱着能把所有问题都解决的想法,因为技术的先进程度还不足以实现,所以要专注于垂直应用;第二是用户的期待要符合实际,这就需要专业人员的讲解,告诉用户什么是可能的,避免客户期望值过高,失望过大;第三是知识图谱和用户画像,知识是正确使用语音交互平台的前提,而用户画像指的是对用户的了解,这对平台的正确应用也是必不可少的。如果语音交互的生态系统能招募广大开发者一同建造,那么显而易见的,系统的建成将会事半功倍。

LW_DQQ2KHN_5BHD_IY1FD

人工智能是为了帮助人而设计的,而不是代替人,秉承这一理念,阿里将会继续努力普及人工智能,为人们带去便利。

本文由云栖社区志愿者小组林一木整理,毛鹤审校。编辑:郭雪梅。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值