Facebook数据丑闻案情始末:用户信息被盗、左右总统选举,两位学者如何用AI技术操纵人心?...

640?wx_fmt=jpeg

导语:这是一个结合的大数据人工智能技术的社会现实问题,现实永远比小说和剧本更精彩。2004年,哈佛大学本科二年级学生马克·扎克伯格创建了Facebook网站。14年来,用户数量一直以令人惊异的速度增长,现已突破20亿大关,成为全球社交媒体帝国。这支曾经让人引以为傲,并被称为伟大而强悍的数据增长团队,如今却“成也萧何败萧何”深陷数据丑闻,股价暴跌,蒸发市值约400亿美元。

640?wx_fmt=png

在大数据概念普及的今天,用户数据研究不是新鲜概念了。全球,各大互联网厂商收集了大量个人行为数据。百度手机APP知道你每天在搜索什么。淘宝和天猫知道你在买什么。携程和滴滴掌握着你的出行数据。数据科学家也可以能准确的了解到信息或者商品,通过哪些用户路径得到了收藏。


生活中的人物形象,和大数据画出的画像也许并不一样,在中国,个人隐私意识并不强,让别人获得再多日常生活的数据并不引起警觉,但是,在美国,大数据预测技术可以影响选民把票投给哪位总统候选人,是希拉里,还是川普。


这是一篇关于Facebook的丑闻,但也有被害的成分。作为全球社交网站的巨头,保护好用户数据,是不可推卸的责任。

 

关键事件一:社交网站Facebook被骗走了用户数据

问题:谁骗了Facebook的数据?

主犯:

一位剑桥大学的学者,同时他也管理着一家名为全球科学研究(GSR)”的公司,该公司通过一个付费的应用程序获得了Facebook的数据。如果个人没有及时调整他们的隐私设置,这个应用程序就会捕获用户的个人信息以及他们的朋友和联系人的数据。(可能就是那个你不会注意,可以勾选的小框子。)


没错,这位就是克里斯托弗·威利(Christopher Wylie)。 

640?wx_fmt=jpeg

同谋:数据脱离学术用途,用于影响选举。

剑桥大学心理学系讲师Dr Aleksandr Kogan,以学术研究为目的收集用户信息,但数据却被转移至剑桥分析公司。他以学术为名骗走了Facebook的数据。

640?wx_fmt=png


犯罪嫌疑人,目前已被剑桥撤职。


案情难点:怎么就拿到5000Facebook用户的数据呢?

犯罪步骤一:

发布一个心理测量研究的app,让参与者填写心理测量的标准技术设计问卷“大五类人格测试”,心理学里经典的性格理论)。

犯罪步骤二:

通过该app获取用户大数据。参与研究的用户必须拥有185名以上Facebook好友,共有27万参与者,所以:27X185=4995万。因此覆盖的用户总数达到5000万人。不仅偷你的信息,还偷你好友的信息。

犯罪步骤三:

Facebook用户有一套自己公布的自我简介,用于在社交网络上介绍和展示自己。这些数据也被获取,最终的得到将心理测量数据和Facebook自我简介相结合的一套数据。

 

关键事件二:网上行为和政治偏好的预测模型,被用于左右选举

 

问题一:机器学习的模型是用来做什么的?

仅仅用人口学变量(如性别、年龄、种族等),预测个体的政治偏好并不准确,但是同时得到社交网络数据和心理测量数据,对政治偏好的预测准确度就会大大增加。而且网上行为和心理测量的心理特质也是可以关联起来的。

 

心理测量数据+社交网络数据倚天剑和屠龙刀合并使用

 

先有数据,再预测。基于前所未有的、高质量、大量的社交网站数据,设计出一个网上行为对政治偏好的预测模型,这个模型可能就是机器学习模型。据推测,可能心理测量得到的心理特质,也被作为机器学习的自变量。心理测量方法假设心理特质是潜藏的,不可直接观测(比如男女性别,就不是心理特质,因为性别可以直接观测)。所以需要设计问卷条目和建立对应的心理测量模型来更好的得出结论,比如你是内向的还是外向的。这些抽象特质,能对政治选举个性化推荐起到作用。我们举一个简单的例子,个性谨慎(conscientious)的投票人可能需要更理性的一些劝说方式。大数据技术使人类社会行为的可预测成为可能。

 

那么能不能说:掌握了大数据技术的政治候选人会有更大的胜算?

640?wx_fmt=png

美国知名政治顾问,预测选举结果的数据专家弗兰克·伦茨(Frank I. Luntz)指出 “再没有比他们更能的了,特朗普的数字团队,他们想出了如何取胜的办法。” 


你可能已经明白了案情的走向。


看看美国对心理学研究和美国竞选的态度。这已经是进入公众视野的数据技术。


“新闻标题:心理学研究是选举的秘密武器”

640?wx_fmt=png

640?wx_fmt=png

“政治心理学家加入选举团队,进行选民数据分析,然后利用调查结果制定策略,以增加选民的支持。共和党总统候选人特德克鲁兹聘请行为科学家(link)从消费者习惯和Facebook网络帖子中收集潜在选民的数据,然后将个性和政治关联应用到这些数据中。最后,实现为特定的选民量身制定推广策略。”


问题二:如何通过了解网友点赞情况来左右选票呢?

 

再举一个例子,如果你是在特朗普和希拉里之间来回摇摆的选民。如果你频频向反对移民政策宽松化的新闻点赞。算法将会向你推送类似“特朗普一直抨击中国人抢了美国人的饭碗”类似的广告,“特朗普主张收紧移民政策”、“特朗普主张去全球化”。最终,你受到了精准推送新闻的影响,认可了特朗普的政治主张,把选票投给了特朗普。实际上,你被推送广告的人或者机构,消无声息的影响了。


精准推送:给不同类别的用户推送满足其需求的相关信息。面对海量的用户,怎么样才能做到精准推送呢?而在这个方面大数据的核心技术——预测能够告诉你谁会点击,谁会购买。预测技术普遍应用于互联网,可以提高用户数量,引导购买,但是实质的结果都是为了影响目标人群。此案中的两位学者,获得数据数据,后用算法进行大数据分析,根据每个用户的日常喜好、性格特点、行为特征,预测他们的政治倾向。可以说剑桥分析公司,他们分析的是人的心理特征。而预测的目的不仅仅是为了知道,而是为了影响,这也由此牵出了,美国大选中的政治对手都在研究彼此用的什么核心技术来助选。就是用算法影响选举。

 

从数据的角度来说,如今的大选是数据科学驱动的,是真枪实战的数据战争。

  

剑桥分析除了与特朗普团队的合作之外,该还参与了美国和英国的几十场政治活动,包括英国退欧。据报道,特朗普在该公司的部分协助下赢得了2016年总统大选后,该公司首席执行官就开始向更多的客户推销其服务。该公司吹嘘说,它可以研究消费者和选民的心理特征,然后用这个“秘密武器”来影响消费者和选民的意愿。公司负责人曾叫嚣:“我们利用Facebook获取了数百万人的个人资料。通过算法建立模型,来找到他们的内心恶魔。

 

结束语:Facebook本身的技术和管理有着巨大的漏洞,被别有用心又掌握着大数据预测技术的人利用,扎克伯格和其团队面临巨大挑战。但是,仅仅是他们的挑战吗,这次丑闻只是科学技术如何影响社会活动这一命题中的冰山一角。

640?wx_fmt=jpeg

出品:谭婧 龚兰蕴

美编:陈泓宇



特约嘉宾龚兰蕴:本科毕业于北京大学元培学院,具有宾夕法尼亚大学应用统计与认知心理学双硕士。感谢特约嘉宾对本文的贡献。

640?wx_fmt=gif

 欢迎关注


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值