《大数据时代》书评及书摘

大数据时代改变了传统的数据分析方式,从关注随机样本和精确性转向处理全体数据和接受混杂性。书中强调,我们不再局限于寻找因果关系,而是探索事物的相关性,以揭示新颖且有价值的洞见。相关关系虽然不解释原因,但能有效预警事件的发生。
摘要由CSDN通过智能技术生成
三天的零碎时间把这本书读完了,内容本身其实很简单,也谈不上特别精彩,五分制的话我只能打三分。

我的理解,数据一生应该是包含了三个阶段:收集,分析,最后是预测。我们总能根据现有的数据(或者经验)预测未来(预测的正确与否是另外一回事),当数据的量级小的时候,能预见的未来可能是模糊的;但当数据积累到一定的程度,你就可能真的能预测未来了。

作者舍恩伯格列出了大数据时代的三个核心点:
  • 不是随机样本,而是全体数据,即全数据模式,样本=总体。在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。
  • 不是精确性,而是混杂性。研究数据如此之多,以至于我们不再热衷于追求精确度。
  • 不是因果关系,而是相关关系。寻找因果关系是人类长久以来的习惯。即使确定因果关系很困难而且用途不大,人类还是习惯性地寻找缘由。相反,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系,这会给我们提供非常新颖且有价值的观点。相关关系也许不能准确地告知我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。在许多情况下,这种提醒的帮助已经足够大了。
相对于上边这些概念性的东西,书中的一些数据和举例可能更有趣一些:
Facebook这个创立时间不足十年的公司,每天更新的照片量超过1000万张,每天人们在网站上点击“喜欢”(like)按钮或者写评论次数大约有三十亿次,这就为facebook公司挖掘用户喜好提供了大量的数据线索。

亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,facebook知道我们的喜好,而linkedin可以猜出我们认识谁。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值