Apache与CDH的比较

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/gdkyxy2013/article/details/77394676

      1CDHHadoop版本的划分非常清晰,只有两个系列的版本,分别是CDH3CDH4,分别对应Hadoop 1.0Hadoop 2.0相比而言,Apache版本则混乱得多

     

  (2 CDHApache在兼容性,安全性,稳定性上有增强。

     

  (3 CDH3版本是基于Apache  Hadoop  0.20.2改进的,并融入了最新的patchCDH4版本是基于Apache Hadoop 2.X改进的,CDH总是并应用了最新Bug修复或者FeaturePatch,并比Apache hadoop同功能版本提早发布,更新速度比Apache官方快。

    

     (4)CDH支持Kerberos安全认证,Apache则使用简陋的用户名匹配认证.

    

     (5) CDH文档清晰,很多采用Apache版本的用户都会阅读CDH提供的文档,包括安装文档、升级文档等。

    

     (6) CDH支持Yum/Apt包,Tar包,RPM包,Cloudera Manager四种方式安装,Apache 只支持Tar包安装。



注:CDH使用推荐的Yum/Apt包安装时,有以下几个好处:

1、联网安装、升级,非常方便

2、自动下载依赖软件包

3Hadoop生态系统包自动匹配,不需要你寻找与当前Hadoop匹配的HbaseFlumeHive等软件,Yum/Apt会根据当前安装Hadoop版本自动寻找匹配版本的软件包,并保证兼容性。

4、自动创建相关目录并软链到合适的地方(如conflogs等目录);自动创建hdfs, mapred用户,hdfs用户是HDFS的最高权限用户,mapred用户则负责mapreduce执行过程中相关目录的权限。

 

没有更多推荐了,返回首页