大数据技术原理与应用 第三版 林子雨 期末复习(一)大数据概述 第一章 P2
大数据概念(4V)
1 volume (大量)
随着传感器等技术的应用,数据规模逐渐增大,而大数据的规模通常达到PB EB级。
2 variety (多种)
大数据涉及到的数据种类多,包含大量结构化与非结构化数据。
3 velocity (高速)
同一时间下有大量数据产生,并且某些数据价值会随着时间流逝下降,因此大数据对数据处理的实时性要求较高。
4 value (价值)
对于大数据而言价值密度较低,整体价值较高,很多有价值的信息分散于海量数据当中。
三次信息化浪潮(每隔15年发生一次)
信息化浪潮 | 发生时间 | 标志 | 解决问题 |
---|---|---|---|
第一次 | 1980 | 个人计算机 | 信息处理 |
第二次 | 1995 | 互联网 | 信息传输 |
第三次 | 2010 | 大数据、云计算、物联网 | 信息爆炸 |
大数据对于研究思维的影响
1 全样而非抽样
大数据时代,随着数据存储与分析能力的提升,更倾向于使用全样数据而非抽样数据解决问题。
2 效率而非精准
由于使用了全样数据因此在传统分析方法中误差的放大问题得以解决,同时由于数据量的激增