影响语音交互普及起来的心理因素有哪些?

什么会成为互联网时代里下一代的交互方式呢?以目前来看,语音交互无疑是接班键鼠交互、触控交互的最大热门。这一点,其实早在很多科幻电影中都可以预见到。

但为什么到今天,我们仍然没见到语音交互全面替代了原来的那些交互方式,用户在使用电脑、随身终端时,依然还是以键盘鼠标、触摸屏为主呢?

前些天在网上看到了一篇文章,叫《为什么语音交互有个心理学问题》(作者@酱卤)。文中首先抛出的问题,正是上面这个。

是的,为什么呢?作者结合老罗(没错就是崇尚情怀的罗永浩)曾经提到过的观点,从心理学的角度提出了以下三个影响了语音交互普及的问题:

问题1:智能语音并不能真正理解人的语言,它不具备人类的智力。
问题2:当人们用语言进行交流的时候,通常希望立即获得回应。
问题3:语言交流的即时性还有一个结果,就是人们期望对声音的反馈也是声音。


文中的观点确实有一定道理。客观来说,目前语音交互之所以还没能完全普及,与这几个问题确实存在一定关系。


但是必须看到,当前在这几大方面上,当前最新的语音技术已经创造了不少突破,用户体验也得到了很好的优化。

以中国移动灵犀云智能语音平台所具备的技术特点为例,我想说一下原文提到的这几个问题:


问题1:智能语音并不能真正理解人的语言,它不具备人类的智力。

原文:现在的智能语音停留在对关键词的内容识别和上下文分析,而机器是没有“语感”的,也不懂得什么语法。这样一来,以人类智力来理解,机器就显得很蠢,而试图和它沟通交流的行为也就显得很蠢。类似的行为其实也适用于文字交流,一旦对话的情境被建立起来,人们就希望对话者的智力水平足以和自己相当。

目前的人工智能水平,确实还不足以使机器具备如人类一般的智力。但以灵犀云为例,目前已经可以向移动应用提供20+种最常见的垂直领域开放语义场景,结合利用知识库和搜索技术实现的智能问答功能,可为用户提供各分领域下的智能语义理解。这样的能力在线上的综合正确率,可达到92%以上。

怎么理解呢?就是说虽然机器目前还无法做到像一个普通人一样跟你谈天说地、大侃家常,但是当你跟它谈的话题落在上图的这些领域时,它已经可以较准确地理解你话语中的含义和所指了。这样的机器可能还不算很聪明,但至少它不蠢。

当你跟灵犀说你饿了,它会聪明地为你搜索附近的美食。



问题2:当人们用语言进行交流的时候,通常希望立即获得回应。

原文:与文字书信不同,语言交流在过去往往是面对面,所以交流是即时完成。但对讲机和即时通讯应用的出现打破了这种即时性:对话者的语言是“互斥”的,不会出现声音的重叠和打断,因此对话者也就没有被置于一个共通的虚拟空间中。它所造成的结果,是这两种形式的语音交流无法提供面对面或电话交流时的畅快感和现场感,也就缺少一部分“对话”的体验。
与之同理,语音交互因为互斥性的特点,很难被当作是和机器对话。所以Siri式的仿自然语言交流也会缺少对话的现场感。


虽然这里提到的互斥性问题目前确实存在,对用户的现场感有一定影响。但现有的语音处理技术已能把反应速度提高到相当不错的水平,使用户不会感觉到明显滞后了。

以灵犀云服务的第一大应用灵犀语音助手为例(见下图),在wifi和4G网络环境下进行语音识别的响应速度只有0.6秒多些,即使在3G环境下也不超过1秒。也就是说当你说完一句话后,半秒至一秒的时间内系统就可以识别出你说的话,然后马上作出回应。这样的速度,应该能让你感到舒心。
 



问题3:语言交流的即时性还有一个结果,就是人们期望对声音的反馈也是声音。

原文:……问题在于,语音合成的技术实力还没有达到人们的期待。生硬的、机器化的声音表达,无时无刻不在提醒着这个对话者是“非我族类”,语音合成的生硬效果也在阻碍着人们将机器视为同等智力水平的个体。

灵犀云具备的语音合成能力,来自科大讯飞的核心语音合成技术,此技术已经连续九年获得国际语音合成大赛“Blizzard Challenge”的桂冠,在语音合成自然度指标上达到了4.2的分值,已经超越了一般真人的发音水平(4.0分)。“生硬而笨拙”的合成效果,已经成为了过去式。

此外,灵犀云提供多达18种以上的不同音色、不同性别、不同年龄段的发音人音库,无论是成熟稳重的男声,还是温柔娇俏的女声,你都可以在这里找到心仪的那把声音;再者,灵犀云对各地方言发音人的支持(粤语、四川话、东北话、河南话、湖南话、陕西话、台湾普通话等),能使你与机器的对话倍感亲切。这种情况下,“非我族类”的心理暗示还会存在么?或者你需担心的,可能是怎么不被合成出来的声音吸引了。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值