1.大数据是什么?
官方的介绍是: 大数据指数据集的大小超过了现在典型的数据库软件和工具的处理能力的数据.
通俗的介绍是: 大量的数据 海量的数据
2.大数据的特点是什么?
主要特点
海量化(Volume): 数据量从TB到PB级别
多样化(Variety): 数据类型复杂,超过80%的数据是非结构化的
快速化(Velocity): 数据量在持续增加(两位数的年增长率)对数据的处理速度要求高
高价值(Vealue): 在海量多样数据的快速分析下能够发挥出更高的数据价值
3.大数据到底能干什么?
快速查询:
在海量数据的背景下,进行数据的快速查找、快速提取(快速查找或提取效率在3秒内).
数据存储
在海量数据的背景下,大数据能够存储海量数据,大数据能够存储单个大文件.
快速计算(离线)
在海量数据的背景下,能够在海量数据的基础上进行快速计算.
实时计算
在海量数据的背景下,对于实时生成的最新数据,需要立刻、马上传递到大数据,并立刻、马上进行相关业务指标的分析,并把分析的结构立刻、马上展示给用户或领导.
数据挖掘.
1.在传统数据无法计算出