什么是大数据?
- 大数据 :指数据集的大小超过了现有典型的数据库软件和工具的处理能力的数据
大数据的特点
主要特点
-
海量化(Volume)
数据量从TB到PB级别 -
多样化(Variety)
数据类型复杂,超过80%的数据是非结构化的 -
快速化(Velocity)
数据量在持续增加(两位数的年增长率)
数据的处理速度要求高 -
高价值(Value)
在海量多样数据的快速分析下能够发挥出更高的数据价值
大数据能做什么:
海量数据背景下
快速查询 - 全量查询
数据存储 - 量大、文件大
快速计算 - 对比传统方案
实时计算 - 最新数据
数据挖掘 - 新价值
海量数据快速查询
在海量数据的背景下,进行数据的快速查找、快速提取。(快速指
查找或提取效率3秒内)
例如:每个用户查询上月手机流量记录或上月通话明细。都是在海量用户
中查询某一个人的记录,三秒内出结果