Facebook的首席技术官：人工智能已用于内容审核，未来会做更多

https://www.toutiao.com/a6696362352897425927/

原文载于Fast Company，作者Harry McCracken

2017年，Facebook因平台内容（例如假新闻、仇恨言论等）引发一系列争议。很显然，Facebook认为解决这些问题的方案就是最古老的信息处理设备——人的眼睛。

Facebook宣布将增加数千名审核人员浏览用户的贴文，以过滤攻击性、非法或其他有问题的内容。这相当于承认仅依靠技术无法遏制社交网络的危险分子。许多专家宣称，并无任何迹象表明人工智能能够在无人为干预的情况下识别和清除有问题的内容。

Facebook的首席技术官Mike Schroepfer在今年举办的Facebook F8开发者大会第二天的主旨演讲中表示，人工智能已经能够大规模检测不适当的内容。他还说道，Facebook及其他公司的研究人员当前正在攻克技术难关，从而让软件能够在较少人工干预下处理更多工作。

在本周早些时候，他在Facebook总部的会议室向我展示了他计划在主旨演讲中展示的图表，其中包括代表各种违规项目（垃圾邮件、假账户、色情、暴力内容）的条形图，统计数据显示了Facebook何时开始利用人工智能识别这些违规项目以及人工智能何时能够承担大部分流程。

Schroepfer希望通过分享这些数据，反驳关于Facebook并未采取谨慎措施清理平台问题内容的观点。然而，他很快就承认还有更多工作有待完成，但并没有批评持怀疑态度的人。

他说，“对于我个人而言，最让人难以接受的事情是有人认为我们根本不在乎。我们并非不在乎，也并非没有将其作为优先事项，同时也并不是因为‘其并非我个人的日常经历’。但人们有权发表自己的观点，直到我们解决这些问题，他们才有理由证明自己的观点。”

Schroepfer非常谨慎地强调，不能忽视人工智能作为解决内容审核问题通用方案的优势。他说道，“我预测在短期内我们还是需要人工参与审核环节，因为这些问题本质上是人的问题，我们需要确定哪些是仇恨言论或人为误导信息。”

但他还说道，人工智能可能会处理越来越多繁重枯燥的审核工作。正如Casey Newton二月份在Verge报道中所述，成天关注Facebook最糟糕用户发布的可怕内容不仅无趣，而且会侵蚀人的灵魂。

Schroepfer说，“有些内容确实不堪入目。因此，如果我们可以删除这些最糟糕的内容，接触这些内容的人就会少一些。”

一个人承担两项工作

Schroepfer估计，他目前大约将一半的时间用于处理Facebook当前面临的技术难题，另一半精力用于其他任务，包括更有趣的未来事项，例如Oculus VR。

他说，“有时，我每天要花70%的时间，有时花30%的时间。”当谈到研究时，他的回答就有些含糊。例如，Facebook关于门户网站视频聊天屏幕智能拍摄的机器调查，其可以帮助公司审查视频，同时更快速删除问题视频。Schroepfer说，“我像是生活在两个不同的世界，这让我感到兴奋。”

技术行业在教授人工智能识别事务（文本和视觉项目）方面取得了一些进展，无需大量人工参与。这项技术超越当前的机器学习技术，但需要进行大量的人类相关前期训练。

Schroepfer说，传统训练“主要存在两大方面的问题”。“一是定制化严重，如果训练未涉及到相关内容，就可能难以发现问题。第二，整个过程进度缓慢，可能需要数周才能建立全新的分类器。”计算机可自动处理的事项越多，在一系列任务中的表现就越好。

Schroepfer提到谷歌正在开展“BERT”研究项目。这相当于变量器的双向编码器，如果你不是人工智能科学家，就很难理解这些事项，但基本思想并不难理解。我们并非用人类选择的案例训练人工智能模型，而是向机器提供类似于文字谜题的项目。这种练习就像“配对游戏”，隐藏句子中的部分单词，让计算机补充缺失的单词。另一种方式是向计算机提供成对的句子，然后让计算机猜测第二个句子是否与第一个句子出自同一篇文章。

计算机科学家正将类似的技术运用于视频审查，例如向人工智能模型提供一段视频和音轨，然后让其预测两者是否匹配。Facebook的科学家还会向人工智能模型提供成对的视频片段，然后让其猜测片段的来源是否相同。根据Schroepfer所述，这种训练方法可以将人工劳动量从12,000小时减少到80小时。他说，“这节省了几个数量级的时间”。

这些文本和视觉谜题输入算法的过程相对容易：Schoepfer说，“你可以输入大量数据，并进行改编。”软件解决的谜题越多，未来处理问题的准确度就越高，因为软件是根据情境线索理解内容——这项技术广泛运用于Facebook，从识别不合格的广告到智能安排新闻资讯。这些技术属于“自我监督”训练类别，Facebook 首席人工智能科学家Yann LeCun将其称之为人工智能在未来十年的重大机遇之一。

更有效训练的关键并不在于降低该流程理解Facebook上内容过程的重要性。相反，这可以通过更多训练处理其他类型的内容，并且可以处理人工难以应对的繁重工作。Schroepfer提到了一个已在Facebook上使用的自我监督学习案例：“如果我们正在训练分类器判断人们是否在谈论选举，我们可以同时训练多种语言，这样在印度等地方的效果会更好。”

Schroepfer最后说道，他能够看到技术行业当前阴霾消散的那一天，这也并非仅Facebook面临的问题。“我认为我们现在对技术的态度极度悲观，或者接近极度悲观。”他补充说道，对于Facebook而言，解决方案的内容包括公司应当在出现问题之前更好地识别问题，继而尽早部署技术和人力资源。

他说，“实际上，我们识别问题的能力正处于历史最强时期，因为其中有些问题是可预测的。我们可以更迅速地应对新事物。即使我们并未预测到问题，我们仍然可以通过运营能力解决问题。”