数据集主要特点 Volume(大量): 数据量巨大,从TB到PB级别。 Velocity(高速): 数据量在持续增加(两位数的年增长率)。 Variety(多样): 数据类型复杂,超过80%的数据是非结构化的。 Value(低密度高价值): 低成本创造高价值。 其他特征 数据来自大量源,需要做相关性分析。需要实时或者准实时的流式采集,有些应用90%写vs.10%读。数据需要长时间存储,非热点数据也会被随机访问。