对于没有使用过智能音箱的读者,可以观看 Echo 的官方广告,直观地体验下智能音箱。
目前的智能音箱多基于语音控制,其基本交互流程可以用图1 概括:1)用户通过自然语言向音箱提出服务请求或问题 2)音箱拾取用户声
音(音箱本地完成)并分析(一般在服务器端完成)3)音箱通过语言播报(音箱端)和 APP 推送(关联的手机等)对用户的请求进行反馈。
图1. 智能音箱基本交互方式
智能音箱可以以自然的方式(自然语言),为用户提供一些常用的服务,未来还可能成为为家庭的控制中枢。
从用户的角度,可直观感知硬件和功能(图2)。其中,智能音箱的功能关系到产品设计和用户体验, 直接关系到产品的成败,我们会在产品分析的文章中进行深入分析。本文对智能音箱的硬件及运行在硬件之上,作为音箱“大脑”的系列算法进行简要介绍,希望读者能对智能音箱有更全面的了解。
图2. 智能音箱硬件组成和功能示意
1. 硬件
图3展示了 Echo 拆解后的部件。可以看到,智能音箱的硬件并不算复杂(相对于无人驾驶等“重型”AI 产品)。但正如下面我们会反复强调的,智能音箱的各个模块都需要结合生产工艺、算法设计、产品体验等多个方面进行细致的打磨,才能达到比较满足的效果,而这其中做出需要多“痛苦的”折衷。
图3. Amazon Echo 拆解图【来源】
1.1 外观设计
智能音箱想要成为常驻案头的“家庭成员”,其形态必然是经过精心设计,在形状、大小、灯效甚至重量等因素要充分考虑在内。图 4 展示了一些智能音箱,读者可根据自己的审美,判断下哪些是想要或不想要放在家里的。
图4. 音箱ID设计(按阅读顺序依次为:Amazon Echo、Google Home、叮咚、若琪、若琪月石、联想音箱)(仅图示设计,不代表实际产品尺寸)
ID 设计除了出于美学和交互设计的考虑外,还要和音腔设计(影响音效)、麦列方案(影响语音交互)等相互耦合,需要通盘考虑。
1.2 扬声器
智能音箱本质上还是一款音箱,因此,提供用户认可的音质是产品存在的前提。但是智能音箱在扬声器的选择上,除了受到音箱尺寸限制,还要考虑麦列的拾间及后续的信号处理。