1.什么是大数据
(1)大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理的处理的数据集合
(2)大数据技术要解决的是海量数据存储和海量数据计算的问题
2.大数据特征
(1)大数据量
(2)速度快
(3)多样化(数据种类和来源多样化):结构化数据,半结构化数据,非结构化数据
(4)价值密度低
固有特征:时效性,不可变性
3.分布式计算
4.Hadoop是什么
(1)是一个开源分布式系统架构,解决海量数据存储和海量数据计算的问题
(2)处理海量数据的架构首选
(3)非常快的完成大数据计算任务
(4)已发展成为一个Hadoop生态圈
5.Hadoop发展
6.为什么使用Hadoop
7.Hadoop与关系型数据库对比
8.Hadoop生态圈
9.Hadoop架构