大数据中的隐藏偏差

    偶读Kate Crawford(供职于微软研究院)女士2013年的一篇旧文 ,仍有所触动,故而作读书笔记一篇。


    先抛一个问题:数据科学的目标是什么?

    笔者认为,人类社会很大的诱惑与恐惧均来自于对未来的不可知。我们因为害怕未知的疾病、灾难,而选择了宗教;因为不确定市场价格的未来走势,而热衷于K线图分析来试图聆听市场的提示;因为不知道谁更愿意购买我们的商品,而建立市场调研与精准营销。所有这一切,都是为了在一定程度上预知未来。因此,数据科学存在的意义,依然要服务于认知世界、挖掘规律、预知未来的范式。而这个流程中,认知世界就已经不是一件简单的事情了。

    

    Kate Crawford在《The Hidden Biases in Big Data》中主要的一个观点在于,数据本身并不是绝对客观的存在,而是人类主观行为的记录。人们记录了数据,并根据各自的理解从其中推导结论。然而,数据采集与分析阶段所隐藏的偏差,将导致较大的风险。因此,对数据偏差的认知,应得到与数字本身一样的重视程度。Kate Crawford举例说,Sandy飓风袭击美国时,从tweet的活跃数据来看,来自曼哈顿的消息量级最大,活跃度最高,似乎会让人觉得曼哈顿就是风暴的中心,其中这

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值