一、Hadoop版本综述
Apache Hadoop的开源协议决定了任何人可以对其进行修改,并作为开源或者商业版发布/销售。
故而目前Hadoop发行版非常的多,有华为发行版(收费)、Intel发行版(收费)、Cloudera发行版CDH(免费)、Hortonworks版本HDP(免费),当然,这些发行版都是基于Apache Hadoop衍生出来的。
- Apache Hadoop
- Cloudera’s Distribution Including Apache Hadoop(CDH)
- Hortonworks Data Platform (HDP)
- MapR
- EMR
- …
其中,CDH版本是开发中常用的一个版本,它的优势明显,我们重点介绍下:
二、CDH简介:
- CDH全称:Cloudera's Distribution, including Apache Hadoop;
- CDH是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建;
- CDH开源,免费;
- CDH提供了Hadoop的核心: - 可扩展存储;- 分布式计算;
- CDH有基于W