言必称大数据的时代,让我们多少有些“审美疲劳”。但如果严格按照大数据的定义来判断,相信大多数公司是根本不存在大数据问题的。你也许有很多数据,但那并不意味着就是大数据。数据库即服务公司MongoHQ的@Codepope最近在博客上探讨了这个问题,以及为何我们要存储这么多的数据,但无法从中获取相应的价值。
大数据实际上是范围极广、数量极大的,超乎你的想象。你也许认为维基百科的数据很大,但它也只是冰山一角而已。人们往往认为“很多的”数据就是所谓的“大”,因此他们无时无刻不在于大数据打交道。这种想法是不对的,我们从很早以前就已经有海量的数据了,那时候甚至还没有大数据的概念。那么大数据究竟是从哪里来的呢?为什么我们需要大数据呢?
时间倒退到上世纪90年代,人们开始认识到以数位的方式存储各种数据是非常便宜的,要比把它们保存在纸上便宜的多。而当某种事物变得足够便宜的时候,它就成为了一种标准。将所有信息都保存起来似乎成为了人类的一种本能,以便我们能够在未来需要的时候找到它。特别是在成本低廉的情况下,何乐而不为?
在这里我还是要推荐下我自己建的大数据学习交流qq裙:522189307 , 裙 里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的),包括我自己整理的一份最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴。上述资料加群可以领取
尤其是在科学领域,科学家们从很早以前就梦想能够把实验中的所有数据都妥善地保存起来。几十年前,美国的Peter Denning就阐述了NASA在保存哈勃空间望远镜的数据时所面对的难题:它每天生成的数据就需要2500张光盘来存储&