李飞飞高徒新项目，一眼看穿你下届总统会选谁！-CSDN博客

翻译 | AI科技科技大本营

参与 | 刘畅

编辑 | Donna

和很多人一样，我们会通过一个人的外表和穿着来判断其经济能力，也会通过字迹来判断其品性。但这篇文章中，斯坦福大学研究人员会通过你所开的车辆类型来判断你可能会在下届总统选举中将票投给川普还是希拉里。

从根本上说，这个研究或者这个结果并不是最近才出现的，市场研究人员和政治分析家已经研究这个问题几十年了，而斯坦福大学更多是借助人工智能在研究方法上进行了创新。

研究介绍

该项研究由李飞飞博士斯坦福AI Lab的学生Timnit Gebru主持。该研究通过算法分析了来自谷歌街景（Google Street View）中的5000万个图像和位置数据，从图像中提取车辆的品牌，型号和年限。经过训练后，算法可以识别给定社区的车辆，判断社区居民的政治倾向。

得益于人工智能方面的最新进展，研究人员第一次能够分析大量的图像，提取可以分类和挖掘的数据，来进行预测收入，政治倾向和购买习惯等事情。

这项研究用到了谷歌街景收集的5000万幅街景图，一共识别了2200万辆汽车，然后被分类到超过2,600个类别，如制造商和型号，位于3000多个邮政编码和39000个投票区。

研究人员招募了数百人对数百万张照片中的汽车进行挑选和分类。一些在线承包商做了一些简单的任务，例如识别图像中的汽车。而其他人则是汽车专家，他们知道一些很细微的差别，比如2007年和2008年“本田雅阁”尾灯的细微差别。

一旦汽车图像工程建成，其速度和预测准确性是非常令人震惊的。它在两周内成功的将五千万张图像中的汽车图像进行分类。如果是一个人类专家进行分类，即使每个图像花费10秒，也需要超过15年。

贝勒医学院基因组研究中心的计算机科学家埃雷兹·利伯曼·艾登（Erez Lieberman Aiden）说：“突然之间，我们可以用对文字分析的那套方法对图像进行同样的分析”。

Lieberman Aiden先生说，对于计算机而言，同人一样，阅读和观察是理解世界的两种截然不同的方式。从这个意义上说，“计算机就没有理解世界的短板了”。

社会意义

识别如此多汽车图像中的细节是一项非常难的技术，更可贵的在于它将新的数据集与社会经济和环境信息的公共集合连接在了一起，然后调节软件的参数以发现其中信息的模式和相关性。因此，这个项目成为了计算机科学家将图像数据更广泛应用的一个经典案例。

康奈尔科技公司的计算机科学家Serge Belongie曾质疑计算机视觉的快速发展，认为其并不能给社会造成影响：“能够识别照片中的内容并不是能促进我们对世界更科学地理解”。

但是，斯坦福的汽车项目让我们看到了计算机视觉和社会之间的有趣联系，但其实并没有那么多惊人的启示。在最近的一篇论文中，也有关于预测中的相关性的：

该系统能够准确预测全国各城市的邮政编码和选区级别的收入，种族，教育和投票模式。
汽车属性（包括每加仑里程评级）发现，美国最环保的城市是伯灵顿，而卡斯帕是人均碳足迹最大。
芝加哥是收入分配水平最高的城市，在不同地区有大量的昂贵和廉价的汽车。佛罗里达州杰克逊维尔市的收入最少。
纽约是汽车价格最贵的城市。埃尔帕索的悍马比例最高。旧金山的外国汽车比例最高。

其他研究人员已经使用谷歌街景数据为影响城市发展，当地社区的民族变化和公共健康的因素提供了视觉线索。但迄今为止，斯坦福大学的项目似乎在最详细的分析中使用了最多的街景图像。

对这项研究的新应用，Gebru持有很高的期望。除了用于人口统计，视觉图像分析技术还可以用于改进对偏远地区的调查以及用于其他用途，例如：监测二氧化碳水平和缓和交通拥挤。

能否取代传统的统计调查方法？

就像我们说的通过衣着和字迹来判断一个人并不总是凑效，这项研究目前还不能百分百自证完美。目前来说，这项研究仍是传统调研方法的补充方法。

论文的第一作者、前斯坦福大学视觉实验室成员Timnit Gebru称：“我并不认为这样的技术可以取代“美国社区调查”，但是可以作为该调查的补充和对数据进行更新。” Gebru现在在微软研究院的人工智能公平、责任、透明性和伦理（Fairness Accountability Transparency and Ethics in AI，FATE)）小组担任博士后研究员。

无法逃避的隐私问题

这项研究只是通过车型预测特定区域的政治倾向，但如果这项研究继续扩展，将会引发数据访问和隐私问题。

斯坦福大学的项目只是预测了社区，而不是个人。但是在德国和其他地方已经提出了关于街景图片的隐私问题。对此，谷歌表示，它将根据具体情况来处理关于大量图像数据的研究请求。

随着无人驾驶技术的发展，汽车车载摄像头才刚刚起步。那么，他们收集的大量图像数据是否可用于研究或保留专有权？

如何看待图像识别技术的进步对研究的影响

新生事物总是正反面相伴。一方面我们在质疑研究的可靠性和隐私问题，但另一方面，我们又期待能从中获益。

加州大学伯克利分校人口学教授Kenneth Wachter说，现在基于图像的研究可以帮助公众对抽样调查的回应率下降。他说，人工智能辅助的视觉人口普查可以填补目前数据中的空白，而且比每十年进行一次的传统人口普查提供更及时的观点，因为这些普查涉及公共政策的热点话题，例如“劣势和机遇的地理和演变。”

哈佛大学计算机科学家兼研究员尼克尔•奈克（Nikhil Naik）在研究城市环境时使用了街景图像，斯坦福大学的这个项目指向了以图像为基础的研究的未来。

Naik先生说：“这是历史上第一次有技术是从大量的视觉数据中提取观点。然而，虽然这项技术令人兴奋，但是计算机科学家需要与社会科学家和其他人密切合作，以确保它是有用的。”