为什么Siri总是像个智障?智能助手背后的技术到底有多难?

本文探讨了智能助手如Siri的发展历程,指出其在语音识别和自然语言理解上的挑战。智能助手作为新的交互界面,以其自然和便捷性受到青睐,但实际应用中仍存在识别不准确、语种限制等问题。文章介绍了智能助手的关键技术,包括自动语音识别(ASR)、语音生成(TTS)、自然语言理解(NLU)、对话管理和自然语言生成(NLG),并强调了自然语言处理在智能助手大脑中的核心作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


导读:本文带你简单了解一下智能助手背后的会话式人工智能技术。

作者:木羊同学

来源:大数据DT(ID:hzdashuju)

01 大话智能助理

智能助理应该是当前人工智能技术最为成功的落地方向之一。我还记得,当初iPhone4S率先推出著名的人工智能助理Siri,马上就有不少评论家预测,Siri也将像iPhone一样,为人类开创一个全新的时代,而调戏Siri也成了当时最流行的游戏之一。当时我们在看视频演示的时候,心中都对Siri充满的期待。

我们一直说,智能手机智能手机,但以前总感觉所谓智能手机,也就是传统的手机+迷你版的电脑,“智能”体现在什么地方呢?现在有了Siri,手机真的能像个老友一样和你聊天打屁,感觉要名副其实得多了。

我们都听过智能助理,可是你是否认真想过一个问题:智能助理对于用户,到底意味着什么?也许不同人能给出很多不同的看法,不过,业界最常见的答案是,提供了全新的交互界面。

我们说Windows是桌面霸主,它的成功,就成功在提供了在当时来说相当友好的交互界面,相比黑乎乎的命令输入,Windows的桌面简单、直观,一下降低了PC的使用门槛。

而智能助理则是在这个已经不太高的门槛上再打一个“骨折”,几乎不需要额外的学习曲线,不用学习使用键盘鼠标,也不用熟悉系统界面,只需要用对话这种最自然的交互方式就能操控机器。相信在今年疫情期间,很多人说话最对的对象,就是家里各式各样的智能助理,譬如智能音箱。

02 新的交互界面

采用对话作为交互方式有很多优点,我觉得有两样最为重要。一样就是自然,人类从一出生就开始学习的技术也就两样,除了蹒跚学步,就只有牙牙学语,说话应该是我们日常中最常见也是最习惯的交互方式。

另一样是便捷,回想一下,手机也好、电脑也好,虽然给我们带来了种种便利,但也禁锢了我们最为重要的双手,而现在回归了用说话的方式操控机器,双手就被解放出来可能干别的事情。

正因为这两样有点,现在智能

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值