1. Hadoop 是什么?
广义上说,hadoop指代大数据的一个生态圈。
狭义上说,hadoop指的是Hadoop这个软件,主要包括三个部分,分别是
- HDFS:分布式文件系统
- MapReduce:分布式计算框架
- Yarn:分布式集群资源调度框架
1.1 Hadoop 历史版本演进
- 1.x版本:Hadoop版本当中的第二代开源版本,主要修复0.x版本的一些bug等
- 2.x版本系列:架构产生重大变化,引入了Yarn平台等许多新特性
- 3.x版本系列: 加入多Namenoode, 纠删码等新特性
1.2 Hadoop生产环境版本选择
Hadoop三大发行版本:Apache、Cloudera、Hortonworks。
-
Apache版本最原始(最基础)的版本,对于入门学习最好。