《大数据时代》读后

前段时间有朋友聊天,说道他们MBA的课后作业是《大数据时代》读后感,想起这本书几年前读过,总结一篇我的读后感。

--------------


提到《大数据时代》,很多人都说这是一场思维革命,让人能处于更大的一个视角来看问题,本书的主要观点是这三点:

1.要全体不要抽样,在大数据时代,是有能力存储并处理全量数据的。

2.要效率不要绝对精确,对于单个个体,大数据预测不到绝对精确,但是多个数量的总体来看,结果是可以符合期望的。

3.要相关不要因果,仅仅说明各个数据项和某个结果有关联,深层次的原因或者理论,则不需要考虑。

它的论据主要有谷歌的流感预测,微博的推送,电商平台的商品推荐,以及各种网站的“为你推荐”等功能。拿流感预测来说,谷歌确实预测到了流感爆发的地点,这对卫生安全方面是有积极的影响。我从微博推送,电商的商品推荐的使用体验来说,却总感觉不太对劲,并没有完全满足我的口味,这个就是不要绝对精确的体验,所以,我也在想,本书中所提到的三点,是否能满足需要,是否完美了吗?

 

首先说要全体不要抽样,大数据需要获得全部数据,在历史数据中先找到和目标结果相关的数据,记录这些数据的特征,以后根据这些特征来预测结果。这里会有问题,全部信息是一个比较理想的情况,现实情况是不可能有全部信息,谷歌在计算流感数据的时候,有考虑南美洲的一只蝴蝶扇了下翅膀吗?如果没有考虑,能确保这只蝴蝶不影响到结果吗?所以,数据的边界是无法界定的,也不可能是全部参与计算的。

 

其次说要效率不要绝对精确,原本以为只是对单个个体的不精确,但是后来发现,对于整体的结果,这个大数据也不是精确的,它计算出来的是某一个事件发生的概率,而且这概率不可能是100%。当然,人们也能接受相对的精确,这只是一个小瑕疵。

 

最后说要相关不要因果,通过对流感事件在发生前后,所有的相关因素进行整理,对比几次之后,大数据获得了它的数据特征,在将来如果有数据和该特征匹配了,那么就可以预测该事件会再次发生。那么来说,大数据只能预测历史事件了?对于以前没发生过的事,大数据就没办法处理了,即便是历史上发生过的事,也因为环境不断变化,所相关的特征也会有所变化,所以,在快速发展的当今社会,大数据的作用会很有限。

 

这让我想起了传统医学,不仅仅是汉医,藏药,甚至在现在非洲的某些部落,在生病或受伤时也会吃草药。每种药草都包含了上千种化学物质,比例也各不相同,这相当于全部数据;中医知道黄连可以泻火,但是不知道是黄连里的哪种物质的功效(中医里的阴阳五行等理论,我认为并非能说明黄连和泻火的因果关系),这和要相关不要因果一样。对于新产生的疾病就无法治疗,比如网瘾该吃哪些中草药呢?我们应该都记得在西医传入以前,中医是无法治疗肺结核,甚至还开出了了“人血馒头”这样的药方。

 

所以大数据时代并非未来,而是一个对大数据处理的一个初级阶段,他所能处理的问题有限,总会有不确定因素,历史总会变化,数据也一直在变化。找不到因果关系时,人类会陷入大数据的海洋中无法上岸。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值