人工智能助理Alexa还是有真人在听？传有大量员工辨识分析数百万条语音

最新推荐文章于 2024-07-21 12:40:56 发布

weixin_33887443

最新推荐文章于 2024-07-21 12:40:56 发布

阅读量132

点赞数

文章标签：人工智能

原文链接：https://juejin.im/post/5cb04fe2f265da03761e7a77

版权

亚马逊（Amazon）人工智能助理 Alexa 应用大量数据训练，以提升语音识别和应答的准确性，但亚马逊从未透露提升 Alexa 准确性的细节，据 Bloomberg 报导亚马逊在训练 Alexa 时，有大量员工辨识分析数百万条语音，由于人类加入，语音助理提供服务的过程，就会面临如何保护用户隐私的问题，至今亚马逊没有给更好的解释。

语音助理训练会使用大量数据，亚马逊宣布时，往往会介绍大量机器学习技术的应用如何提升语音助理的性能，但提升辨识准确率最高效的办法就是让人来听。这一点在亚马逊 Alexa 冗长的用户服务协议中列明，但很少会有 sbf胜博网用户注意到这些内容。随着语音助理在日常生活的应用越来越普遍，用户也开始关注语音助理如何工作，但各大公司对语音助理的服务和技术细节往往避而不谈，特别是有员工参与语音识别这些细节从未公开讨论。

机器学习技术应用时，人类参与数据的分析通常解释为数据注释，这是自然语言辨识、翻译、图像辨识等技术应用的基础工作之一，比如 Alexa 无法准确辨识用户的口音，不同地区重复的地名或其他难以辨识的信息，技术研发时并没有考虑到这些因素，应用就需要人类介入修正。

在全球有成千上万亚马逊公司、供货商和合作方员工参与 Alexa 语音助理的工作，从技术层面来看，半监督学习的模式是提升机器学习技术效率的主要方式，但问题在于大多数用户并不知道自己的语音可能被另一个人听到，同时语音可能包括用户的隐私数据，且这些数据可能被人为滥用，整个过程都得不到有效监管。

据 Bloomberg 报告显示，当员工从 Alexa 语音助理听到一些负面内容，一旦涉及执法机构调查，亚马逊有可能提出这些语音数据，之前有案例 Alexa 语音当成庭审证据，更糟糕的是 Alaxa 部分员工会与其他同事分享、讨论听到语音的有趣或尴尬的内容，此举涉嫌侵犯用户隐私。

亚马逊声明，人为介入只为帮助一小部分 Alexa 语音，以便改善用户体验，这有助于提升语音识别的准确率和升级自然语音理解系统，Alexa 才能为用户服务，但执行过程有严格的技术和操控限制，对任何滥用 Alexa 数据的行为都是零容忍，员工无法获得语音发出者的用户数据，任何涉及个人隐私的资料都是保密的。

转载于:https://juejin.im/post/5cb04fe2f265da03761e7a77

weixin_33887443

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
人工智能助理Alexa还是有真人在听？传有大量员工辨识分析数百万条语音

亚马逊（Amazon）人工智能助理 Alexa 应用大量数据训练，以提升语音识别和应答的准确性，但亚马逊从未透露提升 Alexa 准确性的细节，据 Bloomberg 报导亚马逊在训练 Alexa 时，有大量员工辨识分析数百万条语音，由于人类加入，语音助理提供服务的过程，就会面临如何保护用户隐私的问题，至今亚马逊没有给更好的解释。语音助理训练会使用大量数据，亚马逊宣布时，往往会介绍大量机器学习...
复制链接

扫一扫