在小米十年之际,雷军宣布小米下一个十年的核心战略将升级为"手机 ×AIoT",也就是要打造以智能手机为核心的智能生活体验。配合这一战略升级,小爱同学 5.0 版本起,从语音助手升级为智能生活助手。
“智能协同” 和 “情感陪伴” 是小爱 5.0 的突出特点。
在 MiDC2020 上,小爱团队负责人王刚介绍,智能协同是为应对多设备场景的使用。当家里有几个智能设备时,用户需要以适当的方式优先唤醒某一个设备,要避免的是几个设备同时被唤醒。
在 2018 年时,小爱推出的是 “就近唤醒”,不过后来小米发现,通过设备距离用户远近来决定唤醒优先级并不足够。
王刚介绍,“比如手机和音箱的组合,大部分场景下用户希望音箱优先被唤醒;如果一个房间里面有两台音箱,正在播放音乐的音箱应该被优先唤醒,所以我们将就近唤醒升级为协同唤醒。” 因此,除了考虑距离因素,设备的活跃情况,设备形态都成为考虑的因素。
除了控制设备的功能,提供情感陪伴也成为小爱考虑的重要因素。
主动对话的属性能让小爱对用户表达关心,这体现在一些交流细节方面。比如,用户能够指定小爱 5.0 用特定的昵称称呼自己;小爱也会记住用户的生日,并主动送出祝福。
此外,小爱 5.0 能够定制专属声音,用户可以录入家人的声音,作为小爱的声音。这样,家人的声音就能以智能生活助手的语音形式,作为一种陪伴。5.0版本的小爱还新增了粤语交互、多模态融合交互等功能。
![d5d410e8756a98298bd083ba9669c810.png](https://i-blog.csdnimg.cn/blog_migrate/bc48f974fbce7ada74802a77b5ee71ec.jpeg)
以语音交互为核心的 AIoT
以语音交互为形式,小爱代表了小米对未来 IoT 探索的重要方向。小米人工智能部总经理叶航军、小爱负责人王刚、小米 AI 实验室主任王斌围绕以小爱为主的 AI 技术,与媒体进行了交流。
叶航军在谈及对于 IoT 的发展的思考时表示,以智能手机为例,现在 IoT 可能处于功能机到智能机的早期阶段。不过由于有了智能手机的发展经验,人们会去预测未来 AIoT 比较完善的状态,不过目前行业还没有达到理想的水平。
理想的 IoT 体验背后是 AI 技术的支撑。
王刚分享了目前小爱正在努力突破的语音技术难点,包括唤醒,语音识别,自然语言理解。以唤醒为例,误唤醒依旧是用户的痛点。当用户语音中有类似小爱同学的发音,此时即使没有唤醒意图,小爱依旧会被唤醒。而当多人在对话,或者有嘈杂的背景音时,小爱是不是依旧能准确辨认出某一个用户的唤醒意图。
在自然语言理解方面,基于目前框架,目前小爱的模型中可以有 200 多种组合,王刚表示,这方面目前处于渐进式的进步,需要新的技术突破,才能够更好地处理多轮会话能力,现有的模型技术框架会面临限制。
在语音识别方面,王斌则表示,小爱 5.0 中的动态语音识别技术是一个有前景的技术。动态语音识别的特点是模型跟新快,依据线上反馈进行动态调整。未来希望实现的效果是,针对个体的语音特征进行个性化训练,这样即使用户的普通话语音不标准,也能欧享受质量一致的语音服务。
小米公司在 2016 年将 AI 升级为公司的战略部门,并成立小爱团队。叶航军表示,这个时间点不算早,因此对于小米而言是一个挑战,小米目前的核心竞争力在场景,基于智能产品线,拥有最丰富的场景。在 AI 发展中遇到的最大挑战则是人才。解决这一问题主要是通过在公司内部寻找合适的人才、外部聘请人才、以及培养应届毕业生。
在 MiDC2020 大会的第一天,雷军就表示了对人才的渴求。2021 年将在十大领域招聘 5000 名工程师。他还强调,人才是小米发展的根本大计。
“现在还有很多环节并不智能。” 叶航军在分享小米未来人工智能的长期目标时说,未来希望在小米的业务体系里将各个层面的智能做深入,比如解决客服场景。除了提供消费级产品的服务外,小米也希望将 AI 技术运用到制造业的产业链上游,提升智能制造的水平。
![94a61de4d353aca6d418ffd84f41e36f.png](https://i-blog.csdnimg.cn/blog_migrate/3b579fba96d26c917479507322effc0f.jpeg)