人工智能助理Alexa还是有真人在听?传有大量员工辨识分析数百万条语音

亚马逊(Amazon)人工智能助理 Alexa 应用大量数据训练,以提升语音识别和应答的准确性,但亚马逊从未透露提升 Alexa 准确性的细节,据 Bloomberg 报导亚马逊在训练 Alexa 时,有大量员工辨识分析数百万条语音,由于人类加入,语音助理提供服务的过程,就会面临如何保护用户隐私的问题,至今亚马逊没有给更好的解释。

语音助理训练会使用大量数据,亚马逊宣布时,往往会介绍大量机器学习技术的应用如何提升语音助理的性能,但提升辨识准确率最高效的办法就是让人来听。这一点在亚马逊 Alexa 冗长的用户服务协议中列明,但很少会有 sbf胜博网用户注意到这些内容。随着语音助理在日常生活的应用越来越普遍,用户也开始关注语音助理如何工作,但各大公司对语音助理的服务和技术细节往往避而不谈,特别是有员工参与语音识别这些细节从未公开讨论。

机器学习技术应用时,人类参与数据的分析通常解释为数据注释,这是自然语言辨识、翻译、图像辨识等技术应用的基础工作之一,比如 Alexa 无法准确辨识用户的口音,不同地区重复的地名或其他难以辨识的信息,技术研发时并没有考虑到这些因素,应用就需要人类介入修正。

在全球有成千上万亚马逊公司、供货商和合作方员工参与 Alexa 语音助理的工作,从技术层面来看,半监督学习的模式是提升机器学习技术效率的主要方式,但问题在于大多数用户并不知道自己的语音可能被另一个人听到,同时语音可能包括用户的隐私数据,且这些数据可能被人为滥用,整个过程都得不到有效监管。

据 Bloomberg 报告显示,当员工从 Alexa 语音助理听到一些负面内容,一旦涉及执法机构调查,亚马逊有可能提出这些语音数据,之前有案例 Alexa 语音当成庭审证据,更糟糕的是 Alaxa 部分员工会与其他同事分享、讨论听到语音的有趣或尴尬的内容,此举涉嫌侵犯用户隐私。

亚马逊声明,人为介入只为帮助一小部分 Alexa 语音,以便改善用户体验,这有助于提升语音识别的准确率和升级自然语音理解系统,Alexa 才能为用户服务,但执行过程有严格的技术和操控限制,对任何滥用 Alexa 数据的行为都是零容忍,员工无法获得语音发出者的用户数据,任何涉及个人隐私的资料都是保密的。

转载于:https://juejin.im/post/5cb04fe2f265da03761e7a77

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值