对于“大数据”(Big data)研究机构
Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的
决策力、
洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息
资产。
[1]
麦肯锡全球研究所给出的定义是:一种规模大到在获取、
存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
[4]
大数据技术的战略意义不在于掌握庞大的
数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于
提高对数据的“加工能力”,通过“
加工”实现数据的“
增值”。
[5]
从技术上看,大数据与
云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用
分布式架构。它的特色在于对海量数据进行分布式
数据挖掘。但它必须依托云计算的
分布式处理、
分布式数据库和
云存储、
虚拟化技术。
[2]