现在,大数据和云计算一样,都是时代的话题,本文介绍的是大数据和大规模数据的区别。大数据和大规模数据有区别吗,答案是肯定的,它们的区别主要包括以下两点:
区别一、大数据的规模一定要大,而且比大规模数据的规模还要大
要做一些预测模型需要很多数据,训练语料,如果数据不够大,很多挖掘工作很难做,比如点击率预测。最直白的例子,如果你能知道一个用户的长期行踪数据,上网的行为,读操作和写操作。那么几乎可以对这个人进行非常精准的预测,各种推荐的工作都能做到很精准。
区别二、大数据首先不是数量上的堆砌,而是具有很强的关联性结构性
比如有一种数据,记录了世界上每一颗大树每年长高的程度,这样的数据不具有价值,因为只是简单堆砌。如果数据变成,每一个大树记录它的,地点,气候条件,树种,树龄,周边动植物生态,每年长高的高度,那么这个数据就具有了结构性。具有结构性的数据首先具有极强的研究价值,其次极强的商业价值。
在比如,淘宝的数据,如果只记录一个交易的买家,卖家,成交物品,价格等信息,那么这个商业价值就很有限。淘宝包含了,买家间的社交关系,购物前后的其他行为,那么这个数据将非常有价值。因此,只有立体的,结构性强的数据,才能叫大数据,才有价值,否则只能叫大规模数据。