(一家之言,不喜勿喷)
2014年,大数据可谓是互联网用烂的词之一了,动不动就是大数据,大数据预测世界杯之类的。
各方培训机构也纷纷开设hadoop之类的课程,动不动就说是大数据世界已经到来。
本人差不多两年前就开始接触hadoop,大数据,说实话,一开始对大数据是十分有热情的,也认为大数据的前景非常好。
不过,大数据真的那么火吗?
我看未必,大数据时代还早着呢。
互联网上自称是大数据是应用根本算不上是大数据,举个例子,大数据预测世界杯,就算把人类所有的足球比赛都拿来预测,那有多少数据量,100G已经是顶天了, 100G算得上是大数据吗,全部的数据都适用吗?答案是否定的,过多的数据参杂进来,就算算法逆天也会产生副作用。
类似这样的应用,这样的数据量根本不是大数据,根本用不上hadoop,说白了就是数据挖掘而已,而今人们说的大数据,其实就是数据挖掘。对于现在互联网对大数据的热情,对大数据的跟风,其实是非常不一样的,试想,有多少公司拥有大数据?一天几百GB的数据根本用不上hado