CDH
CDH是Cloudera的100%开放源代码平台发行版,包括Apache Hadoop,是专门为满足企业需求而构建的。CDH可立即提供企业使用所需的一切。通过将Hadoop与十几个其他关键的开源项目集成在一起,Cloudera创建了功能先进的系统,可以帮助您执行端到端的大数据工作流程。
CDH中的重点项目
为什么需要CDH?
大致提出一个问题,假如公司要求给500台机器,进行安装hadoop集群。
只给你一天时间,完成以上工作。
或者如果对于以上集群进行hadoop版本升级,你会选择什么升级方案,最少要花费多长时间?
你在过程中会大大考虑新版本的Hadoop,与Hive、Hbase、Flume、Kafka、Spark等等兼容?
集群的版本限制很重要。
针对于:
Apache Hadoop 不足之处 版本管理混乱 部署过程繁琐、升级过程复杂 兼容性差 安全性低
CDH是你一个很好地选择。
通过基于Web的用户界面,支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop,简化了大数据平台的安装、使用难度。
CDH的好处:
- 版本划分清晰
- 版本更新速度快
- 支持Kerberos安全认证
- 文档清晰
- 支持多种安装方式(Cloudera Manager方式)
安装方式
- Cloudera Manager
- Yum
- Rpm
- Tarball
CDH5.4
- http://archive.cloudera.com/cdh5/
Cloudera Manager5.4.3:
- http://www.cloudera.com/downloads/manager/5-4-3.html