一、大数据是什么?
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。
大数据就是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;是“未来的新石油”。
大数据带来的变革
- 更多:带来更多的是信息,因为不是随机样本而是全部的数据;
- 更好:不是因果关系而是相关关系;
- 更杂:不是精准性而是混杂性。
二、大数据的特征和结构
1、特征
- 容量:数据的大小决定所考虑的数据价值和潜在的信息;
- 种类:数据类型的多样性;
- 速度:指获得数据的速度;
- 价值密度低:合理运用大数据,以低成本创造高价值;
- 复杂性:数据量巨大,来源多渠道;
- 真实性:数据的质量;
- 可变性:妨碍了处理和有效地管理数据的过程。