Apache Hadoop
由Apache 公司开源的Hadoop版本。涵盖了最原生的Hadoop特性,所有的Hadoop发行版均基于该版本进行改进。
Cloudera CDH
由Cloudera公司发行的Hadoop版本,全称(Cloudera’s Distribution Including Apache Hadoop)。该版本在基于原生Apache Hadoop版本进行改进,添加了补丁和自行开发的组件,更加稳定易用。目前国内使用最多的版本。
Cloudera manager的概念
Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。
cloudera manager的功能
- 管理:对集群进行管理,如添加、删除节点等操作。
- 监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。
- 诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。
- 集成:多组件进行整合。
cloudera manager的架构
理解:
- Server:负责软件安装、配置,启动和停止服务,管理服务运行的群集。
- Agent:安装在每台主机上。负责启动和停止的过程,配置,监控主机。
- Management Service:由一组执行各种监控,警报和报告功能角色的服务。
- Database:存储配置和监视信息。
- Cloudera Repository:软件由Cloudera 管理分布存储库。(有点类似Maven的中心仓库)
- Clients:是用于与服务器进行交互的接口(API和Admin Console)