何为大数据,广义上是指物理世界到数字世界的映射和提炼。通过发现其中的数据特征,从而做出提升效率的决策行为。狭义上,大数据是通过获取、存储、分析,从大容量数据中挖掘价值的一种全新的技术架构。定义表明大数据是那些拥有一系列关键特征的数据:容量、速度、多样性、低价值密度和真实性但也包括穷举性、分辨率、索引性、相关性、扩展性和可扩展性然而,这些定义缺乏本体论的清晰度,该术语充当了广泛选择的数据的无定形、包罗万象的标签。我认为大数据大体上可以用5个“V”定义。5V是指具有海量(Volume)、多样(Variety)、时效(Velocity)、精确(Veracity)和价值(Value)这5种特征的数据
大数据研究是近几年信息处理领域最热门的研究方向,已经引起了工业界、学术界乃至政府部门的高度关注.大数据之所以备受关注,是因为大数据里面蕴藏着巨大的价值.如何把蕴藏在大数据中的价值挖掘出来,为企业或政府部门提供决策支持具有重要的意义.大数据给传统的机器学习带来了许多挑战,这些挑战可以从大数据的5个特征或从5个不同的角度进行分析解读。
Volume:释义大量;即采集、存储和计算的数据量都非常大。在广义的计算机存储计量单位上,其存储单位有bit、B、KB、MB、GB、TB等。因为目前计算机都是二进制的所以用2的