一. 简介
众所周知,在大数据领域要想搭建并管理服务器集群有常见的有三种方式一种是人工搭建Hadoop等组件集群并管理服务器集群,这种方式在自己做实验或公司poc某个项目时采用,一般服务器规模是1~5台,生产集群肯定不会用这种方式,10几20几台服务器甚至是上白台上千台服务器,手动一台一台的去ssh,scp等命令实在是太累了,于是就有了第二种方式用集群管理框架去搭建,比如Cloudera Manager,Ambari,这些集群管理框架的原理也很简单,也还是用scp,ssh等搭建集群的命令去操作,只不过它们是用脚本去执行scp,ssh等命令,过程跟人工搭建集群是一模一样的,对于集群配置的修改只需要在WebUI上点点点,便将操作转换成服务器上的linux命令去修改组件的配置文件(是的,有时候赚钱就是这么简单,东西是一模一样的,只不过人家是优化过程提升效率),第三种方式是用docker去安装集群并管理集群,这种docker的方式的体验感介于第一种方式与第二种方式的之间,对于这种方式感兴趣的同行可自行搜索“docker搭建大数据集群”,我相信会有很详细的操作文档。
对于采用第二种方式中的Cloudera Manager与Ambari,它们各有什么优缺点呢?下文我将从定义对比,功能对比,操作对比,稳定性对比,社区支持对比来阐述。
二.定义对比
Cloudera Manager::
Ambari:
三.功能对比
Cloudera Manager:
Ambari:
在功能上,cloudera Manager与Ambari都可以创建集群,管理集群,监控集群,但cloudera Manager功能更强大,比如:它可以创建多个集群,Ambar只能创建单集群,其他集群只能视为远程集群;Ambari在功能上的优势是它没对组件功能做限制,比如:Hbase集群的灾备,cloudera manager社区版是不支持的需要付费升级到企业版才能使用,Ambari对此免费。
四.操作对比
无论是Cloudera Manager还是Ambari都提供了WebUI用户接口对集群进行管理,只需要在WebUI上点点点就可以管理集群。(以下截图来均自于网络)
Cloudera Manager管理主界面:
Ambari管理主界面:
五.稳定性对比
Cloudera Manager从2009年的第一个版本到2019年大大小小共发布了50次以上,具体次数不详,最新版本是在2019年3月份发布的6.2.0版本。Ambari从2013年第一个版本到2019年共发布了38次,最新的版本是在2018年末发布的2.7.3版本。
业界公认Cloudera Manager的稳定性优于Ambari。
六.社区支持对比
因为Ambari是完全开源的,有很多企业在其基础上做二次开发进行个性化订制对Ambari的解剖较深入,所以社区活跃度要比Cloudera Manager的社区活跃度高。足够多的眼睛,才能让产品缺陷尽早地付出水面
七.总结
对于Cloudera Manager于Ambari的对比,并没有绝对的第一,在框架的选型中采用哪个框架,取决于业务需求,如果只是简单的想搭建集群和管理集群可采用Cluedera Manager的社区版;如果资金允许,并希望使用框架的高级功能和有个强大的技术服务团队来解决框架使用中的各种问题,可以采用Cloudera Manager的企业版;如果需要使用各组件的高级特性和对框架有较深入的研究和个性化扩展可采用Ambari。
参考文档:
https://hortonworks.com/apache/ambari/#section_1
https://www.cloudera.com/products/product-components/cloudera-manager.html
http://ambari.apache.org/