大数据:
指数据集的大小超过了现有典型的数据库软件和工具的处理能力的数据。
字面意思:
可以理解为大量的数据,海量的数据
主要特点
- 海量化 (Vloume)
数据量从TB到PB级别
- 多样化 (Variety)
数据类型复杂,超过80%的数据是非结构化的
- 快速化(Velocity)
数据量在持续增加(两位数的年增长率)
数据的处理速度要求高
- 高价值(Value)
在海量多样数据的快速分析下能够发挥出更高的数据价值
大数据能做什么:
海量数据背景下
快速查询 -全量查询
数据存储 -量大 、文件大
快速计算 -对比传统方案
实时计算 -最新数据
数据挖掘 -新价只