大数据的定义
英文名称为Big Data,Gartner将其定义为:需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
区别于海量数据(Mass Data)和非常大的数据(Very Large Data),不仅意味着数据的大容量,还有一些其他特点。
国际数据中心(IDC)定义大数据为:大数据技术描述了一个技术和体系的新时代,被设计用于从大规模、多样化的数据中通过高速捕获、发现和分析技术提取数据的价值。表明了大数据的四个显著特点:容量(Volume)、多样性(Variety)、速度(Velocity)和价值(Value).
数据分析
数据分析是用适当的统计分析方法,对收集来的大量数据进行分析,提取有用信息和形成结论并对数据加以详细研究和概括总结的过程。数据分析可分为三个层次:描述分析、预测分析和规范分析。大数据分析是指对规模巨大的数据进行分析,是从大数据到信息、再到知识的关键步骤。
数据挖掘
数据挖掘(Data Mining)是指从数据集合中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有用的信息。提取出来的知识一般可表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式。