知其然就够了——大数据时代的思考之一

小时候,我常常被教育,只知其然而不知其所以然是不行的,所以,一定要打破沙锅问到底。这最终导致我高考选择了理科,后来又选择了物理,因为我想要搞清楚这世界所有事物存在的道理。但最终让我越来越迷惑,特别是到了后来的量子力学,一切理论都是建立在某个假设的基础之上的,只要能得出符合条件的结论,反过来就能证明假设是成立的,这总让人感觉有些怪怪的。于是我开始怀疑自己的选择,就像牛顿最终决定相信一切都是出自上帝之手一样,我也做出了自己的改变,变身为一名程序员。至少通过自己的工作,可以让人享受到实实在在的成果,而不必强迫自己去寻找所有事情的因果关系,这比写代码更让人头痛。

不知从什么时候开始,大数据就忽然走进了我们的生活,不管真明白的还是装明白的,大家都在兴致勃勃地讨论大数据。我本以为可以快快乐乐地写代码直到退休,却忽然发现不管到哪里都逃脱不了理论的探究,人们总是固执地想要知道到底是先有鸡还是先有蛋,人到底是不是猴子变的。互联网的发展又给了人们无穷的想像力,让人错误地以为电脑总有一天能替代人脑,机器人最终要统治世界。

的确,经过几十年的信息化发展,很多企业和组织都积累了大量的数据,这些数据放在那里很占地方,需要人员去维护管理,还需要消耗电力、折损硬件设备。人们曾经尝试用传统的数据库方法试图去从这些数据中压榨剩余价值,也就是所谓的数据挖掘了。但根据我的观察和体验,这种努力几乎没有啥效果,只是让软件供应商白白又捞了一笔。以前还没想明白是啥原因,大数据时代的作者维克托的分析一下让我找到了答案。原来,传统的关系数据库分析方法又把人带到了去探究因果关系的怪圈中。各种事务间的关系可能永远都理不清楚,那为什么不跳出这个魔咒,只要找到解决问题的方法就行了,没有必要在理论中纠结。

当然,大数据的分析方法告诉我们做事的方向而不必深究这么做的原因,因为人们的认知能力有限,我们需要时间去探索这些未知的奥秘,但这不能成为我们做事的障碍。很多时候人们只需要知道这么做是对的就行了。这实际上是给我们提供了一种做事的方式,这本身就是一个理论,对于程序员来说,实际上也是在提醒我们,在大数据时代,对海量数据的分析方式需要换一种逻辑,原有的那套数据库系统是不适用的。这并不是说原来的关系数据库模型不行了,那对于传统的数据管理依然是目前最好的方法,但对于海量的数据分析来说则显得力不从心了。

这时我想到在股沟公开其模型之前我对它的认识,当时就以为是建立在传统的关系数据库之上的,成千上万的小型机组成庞大的集群。现在想想,原来无意中我又回到了我的物理思维上了。

发布了750 篇原创文章 · 获赞 38 · 访问量 144万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览