—— 原文发布于本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),欢迎关注。
一提到大数据的特性,很多人马上就会想到3V、4V,那么大数据究竟有多少个V呢?
在大数据的不断发展阶段,业界对大数据的特征认识也在逐步完善,涵盖范围也更加全面。
1、3V
2001年麦塔集团(META Group)分析师莱尼在一份报告中对大数据提出了“3D数据管理”的观点,即认为大数据将往高速、多样、海量3个方向发展,提出了3个特性:高速性(Velocity)、多样化(Variety)、规模化(Volume),统称3V。
3V特性是大数据最具代表性的特性,被麦肯锡、IBM、微软等多家公司所认可并不断在大数据报告中提及。IDC(International Data Corporation,国际数据公司)在给大数据下定义时便是引用了3V的特性:“大数据技术是新一代的技术与架构,它被设计用于在成本可承受的条件下,通过非常快速(velocity)的采集、发现和分析,从大体量(volumes)、多类别(variety)的数据中提取价值”。
2、4V
4V也是广受认可的大数据特性,在3V的基础上再加上了价值(Value)的维度,主要强调大数据的总体价值大,但价值密度低。
规模性(Volume)、多样性ÿ