大数据时代的风险与责任

本文章为《大数据时代:生活、工作与思维的大变革》一书中第三部分《大数据时代的管理变革》的读书报告,大部分观点来源于原作,荣耀属于原作者。

先来个网上对big data的吐嘈

Big data is like teenage sex:

everyone talks about it,

nobody really knows how to do it,

everyone thinks everyone else is doing it,

so everyone claims they are doing it.


中枪之余也跟风来聊一聊在大数据时代到来的形势下,各方可能会遇到的风险以及应当承担的责任。

先来总结下书中前两部分所阐述的大数据所带来的思维变革

1. 处理的数据不是随机样本,而是全数据,即“样本=数据”

2. 不要求数据的精确性,容忍错误

3. 分析的数据和结论不是因果的,而是相关的

论及大数据所带来的风险和威胁,最容易想到的,也普遍最为关注的一个问题就是个人隐私问题。

我们现在已经处于一个信息高度发达的时代。稍微懂点儿搜索技巧,甚至都不需要什么技术,就可以根据少量的信息比如姓名或者常用ID就能够搜索出一个人的详细资料出来,其中还包括许多敏感的信息。在网上购物后的快递单,也成为了“商品”,被不良快递贩卖给第三方,将个人信息泄露给其他人,而从中获利。

而大数据的到来,可能会更令人感到恐慌,因为被获取的数据不只是碎片的样本,而很可能是全部,而被获取的已经不只是电话住址那么简单了。

以当下流行的微博和社交网站来说,根据用户所发布的内容和消息,经过分析处理之后,是可以很简单的推算出用户的位置、兴趣、爱好,在数据量足够多的情况下,甚至能够较为准确的评估出一个人的性格、品味、收入、日常习惯、情感经历等;而根据关注关系能够轻易得到用户的关系和社交领域和范围,甚至能够分析出哪些人是最为亲密的要好的。而这些数据都是在用户主页上公开的,任何人都能够获得。

又如亚马逊、京东、淘宝这些电商,这些网站会记录下用户的点击信息、购买记录和支付信息,这些网站便可以根据这些信息推测出用户的喜好或者是其感兴趣的东西,然后向用户推荐用户可能喜欢甚至会买下的商品,从而提高交易量。其实这是一种比较隐蔽的广告投放方式,用户也比较乐意接受的方式,因为有些情况下推荐系统是能够给用户提供方便的。然而,如果这些电商将用户的数据二次利用于其他方面,因为这些信息包含了用户的订单信息和支付信息,进行分析处理,是可以预测用户经济收入、消费习惯、信用情况等有价值的隐私内容,相信还能得到更多其他相关的结果,此时,用户的数据和隐私便成为刀俎上的鱼肉。

现在我们一连接到互联网就不可避免地留下了个人信息,甚至在生活中也俯拾即是,如电话的通话记录、出入门禁的信息、在监控中出现的情况,很多日常生活中的行为都会产生数据,而这些数据在某种情况下是可以被发掘利用的,只是目前还没较广泛的意识去利用罢了。

对于某些行业公司,是很乐于得到这些被大数据预测出来的个人信息的,比如银行、保险公司、风险投资公司、商场等等。拥有这些信息,银行便能够更全面的评估客户的经济以及信用状况,来决定是否发放贷款以及贷款的数目;保险公司则根据更多的信息来权衡怎样针对个人来制定保险金额和赔付比率;商场可以通过了解用户的生活习惯,针对性地发放促销广告和优惠劵从而吸引顾客。但对于个人来说,应该是把双刃剑,用户必然会从中受益,但是在某些场合则会因为这些预测的信息而遭受意外的损失,贷不到款、支付更多的保险金、被不怀好意的人骚扰等等。

显然,个人隐私的危机给大红大紫的大数据泼了一盆冷水,在狂热的背景下,它所带来的影响是需要仔细斟酌思量的。

同时,如何对大数据所预测的结果进行利用同样是一个值得讨论思考的问题。

书中给了一个很有深度的讨论。大数据可以被运用在维护治安、降低犯罪率上,这是没有啥好质疑的。假如数据足够完整预测足够精确,便能够将预测精确到个人上面,从而在罪犯实施犯罪之前将其抓获,预防犯罪事件的发生。假设这个前提成立,那么该如何处置这个没有犯罪的罪犯呢?如果对他进行处罚,这是有违当前的法律原则的,通过假定推论便对未实施的行动进行定罪,这是绝对不允许的,否则每个无辜的人都有可能成为牺牲品,决定人的是数据计算出来的信息,人的自由意志荡然无存,严重破坏了司法的公平正义;如果不对他进行惩罚,“罪犯”很有可能继续作案,而这一套系统便失去了其作用。在机器预测罪犯会做某事的时候,说明了罪犯已经别无选择去做某事,在这种情况下,罪犯是不需要对其行为负责的,就如同他是被人用枪指着不得不去做某件事一样,别无选择所以无需承担责任。这是悖论。再唠叨一些,这也能推出相关部门的失职,因为没有人会去冒着巨大风险去犯罪的。

其实,这个推理是漏洞百出的,从假设开始就是错的。这就是一种对大数据进行预测分析的迷信和滥用。回顾一下大数据所带来的思维变革的第三条,大数据分析得到的结果是相关的而不是因果的,分析的预测结果本质上应该是一种最大可能的估计,而不是绝对的,因为个人的自由意志是不容被忽视的,个人的意志不应该也不能够受到集体意志的冲击,这是对人类最基本权利的蔑视和亵渎。当然,大数据所作出的预测有参考借鉴的意义,但不是绝对的行动指南,该怎样划清人与数据之间的界限,这是需要重新考量的。

伟大的事物都有其硬币的两面,像核能、基因工程、互联网、智能手机、等等等等,大数据亦是如此。事物的好坏完全取决于我们是对其进行利用或是滥用,因噎废食必然是不符合社会发展潮流的。新事物的产生也同样会带来新的管理规范,大数据时代的来临,相应的规范机制也亟待去建立。

关于个人隐私的保护

传统的方法便是通过许可和匿名两种方式来保护个人隐私。然而大数据时代的到来打破了这些传统方法的契机,许可和匿名已经不可能适用了。对于前者,用户不可能每次操作都和数据采集者签订许可,因为这样会特别频繁,比如不可能每次使用google搜索的时候都需要和google签订许可,而大数据具有二次可利用性,在签订许可的时候,完全不会知道将来会可能利用这些数据产生其他的用途和预测,这份许可也就无效了。对于后者,书中给出了实例说明了在大数据时代背景下,已经不可能完全的隐身,屏幕前的到底是人是狗已经无法继续伪装下去了。

其实保护个人隐私最简单直接的方法就是数据使用者直接承担责任。就像员工为公司工作,员工有责任和义务为公司保守秘密,即使跳槽为其他公司工作之后,也同样需要注意不侵犯之前公司的利益。这种模式应该是可以借鉴的,数据使用者必须受到约束,也必须对所使用的数据负责,不得侵犯任何人的合法利益。

相信不久相应的监管机制以及相应的职业也会应运而生,数据的使用情况和保存情况会被第三方监督,以杜绝数据被非法利用的可能。


关于对大数据预测的运用

上面的大数据预测分析应用于预防个人犯罪的例子是令人恐慌的,稍有不慎谁都有可能成为被怀疑的对象。其实,主张用预测来代替人的判断这何尝不是一种倒退。首先,事物的发展是具有不确定性的,预测是基于数据产生,是概率最大最有可能发生的事情,是一种集体的意志。如果以预测结果来作为判断依据,在宏观上多个相同事物的发展的拟合结果可能会很准确,但对于个体来说,不能否定特殊情况的存在。在对个人的行为的预测上,这点尤其不适用,个人是具有自由意志的,不可能有绝对的必然性。其次,这将会是对人类自由的蔑视和亵渎,如果迷信于预测分析,人的自由意志就不复存在了。

我认为应该明确的是,大数据的预测分析应该是一种工具,服务于人,合理利用而不是滥用它。应该清晰明确其预测分析的实质,虽然在很多种情况下其预测结果近乎准确但也不能过于迷恋。人是具有自由意志的存在,大数据的预测分析只是为制定决策提供参考和借鉴,最终作出判断的应该是人而不是机器,切不可以本末倒置。


大数据俨然成为一股不可阻挡的洪流,在为我们生活带来变革的时候,它所带来的问题和影响依然需要关注和思考,从而真正利用好大数据。






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值