沈阳海潮科技有限公司智能助手Siri太易被唤醒?苹果考虑使用AI改进
腾讯科技讯,4 月 17 日消息,据外媒报道,今年,苹果智能助手 Siri 引发的问题不断,始终占据着媒体上的主导地位。而 Siri 的成功之一,即它在听到“Hey Siri”的发音时就开始倾听的功能,也已经成为《机器学习期刊》有关苹果需要应对的最新主题,这也暗示了 Siri 未来的改进方向。
苹果解释称,iOS 设备现在不断地监听提示,并指出人工智能(AI)的进步可以消除 Siri 对初始训练的需求。在“个性化 Siri”中,Siri 团队指出,该功能面临的最大挑战是意外激活和意外错过激活。目前,苹果试图通过利用设备主人的声音设置 Siri 来防止这些问题,要求用户对 Siri 进行简短的训练,并用五种对话来创建用户资料特征。然后 Siri 悄悄地添加用户的 35 个“被接受”话语,帮助改善个人资料。
有趣的是,“Hey Siri”的触发点是,这个配置文件不仅仅是试图匹配单个语音输出,而是最终包含了这个短语的基线版本,有 40 个变体可被接受。Siri 只会在给定的“Hey Siri”话语等于或高于平均得分的情况下才会被激活。该设备还存储了 40 个“Hey Siri”的请求记录,使用户的个人资料在没有经过用户重新培训的情况下得以重建,而苹果则通过软件更新改进系统。
将来,苹果希望 Siri 不必接受预先训练,用户的配置文件将会被清空,然后通过用户许可,随着更多请求的加入,Siri 能自我成长和更新自己。该公司还在研究如何屏蔽“虚假接受”,即 Siri 被用户以外的其他东西唤醒。使用深度神经网络,苹果相信它可以将“虚假接受”率降低 50%,降低错误拒绝率(当用户说“Hey Siri”时设备没有回应)约 40%,而 Siri 被其他人激活的几率可降低 75%。
另一个问题是让 Siri 在更大和嘈杂的环境中表现得更好,比如汽车或者有风的户外环境。苹果公司的团队表示,目前正在研究如何处理与用户个人资料中现有的“Hey Siri”录音严重不匹配的环境,但在所谓的“多风格训练”中取得了成功。在这种训练中,训练数据的一个子集被不同类型的噪音和混响所增强。
因为苹果始终在改进 Siri,而且并不一定会改变所有调整,所以不清楚上面提到的改进会在什么时候实现。在 6 月份的全球开发者大会上,苹果经常强调 Siri 的重大变化,鉴于最近对 Siri 缺点的讨论,我们预计在不久的将来会听到有关 Siri 更重要的消息。