Cloudera的CDH和Apache的Hadoop的区别

转载 2015年07月07日 16:30:21

http://wenku.baidu.com/link?url=x9xRWvuZuUMFKgN9McNY4DSAGXCi3dlUFMtnDE-Lg39_VeOUgUkm9L_1M4g1JID6vtVxO8jfvizkmZADdlpuEOo5ICEF_M92Eo9uB2fhmE_

目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)、Hortonworks版本(Hortonworks Data Platform,简称“HDP”),对于国内而言,绝大多数选择CDH版本,CDH和Apache版本主要区别如下:
(1) CDH对Hadoop版本的划分非常清晰,只有两个系列的版本,分别是cdh3和cdh4,分别对应第一代Hadoop(Hadoop 1.0)和第二代Hadoop(Hadoop 2.0),相比而言,Apache版本则混乱得多;比Apache hadoop在兼容性,安全性,稳定性上有增强。
(2)CDH3版本是基于Apache hadoop 0.20.2改进的,并融入了最新的patch,CDH4版本是基于Apache hadoop 2.X改进的,CDH总是并应用了最新Bug修复或者Feature的Patch,并比Apache hadoop同功能版本提早发布,更新速度比Apache官方快。
(3)安全 CDH支持Kerberos安全认证,apache hadoop则使用简陋的用户名匹配认证
(4)CDH文档清晰,很多采用Apache版本的用户都会阅读CDH提供的文档,包括安装文档、升级文档等。
(5)CDH支持Yum/Apt包,Tar包,RPM包,Cloudera Manager四种方式安装,Apache hadoop只支持Tar包安装。
注:CDH使用推荐的Yum/Apt包安装时,有以下几个好处:
1、联网安装、升级,非常方便
2、自动下载依赖软件包
3、Hadoop生态系统包自动匹配,不需要你寻找与当前Hadoop匹配的Hbase,Flume,Hive等软件,Yum/Apt会根据当前安装Hadoop版本自动寻找匹配版本的软件包,并保证兼容性。
4、自动创建相关目录并软链到合适的地方(如conf和logs等目录);自动创建hdfs, mapred用户,hdfs用户是HDFS的最高权限用户,mapred用户则负责mapreduce执行过程中相关目录的权限。
参考文档:
http://www.infoq.com/cn/articles/hadoop-ten-best-practice
http://heipark.iteye.com/blog/1182466
http://dongxicheng.org/mapreduce-nextgen/hadoop-distribution-selection/

相关文章推荐

Cloudera的CDH和Apache的Hadoop的区别

Cloudera的CDH和Apache的Hadoop的区别目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Clou...

Cloudera的CDH和Apache的Hadoop的区别

目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’s Distributio...

CDH(Cloudera)与hadoop(Apache)对比

转载 http://blog.csdn.net/cnhk1225/article/details/50357744 1.hadoop有几个版本? 2.CDH有几种安装方式? 3.CDH在安装认证...

CDH(Cloudera)与hadoop(Apache)对比

问题导读: 1.hadoop有几个版本? 2.CDH有几种安装方式? 3.CDH在安装认证方面做了什么改变? Cloudera的CDH和Apache的Hadoop的区别...

CDH(Cloudera)与hadoop(Apache)对比

问题导读: 1.hadoop有几个版本? 2.CDH有几种安装方式? 3.CDH在安装认证方面做了什么改变? 目前而言,不收费的Hadoop版本主要有三个(均是国外厂商...

Apache Hadoop(Cloudera CDH4)安装需要注意的几点

Cloudera CDH4安装方法有三种: 1、通过Cloudera Manager自动安装(只支持64bit linux操作系统); 2、通过资源包,利用Yum命令手工安装; 3、通过下载的t...

HDFS-HA:Hadoop-Cloudera-cdh4版本的HDFS自动Failover(zk-based-failover)分析

转帖请注明本空间地址:http://blog.csdn.net/chenpingbupt  从evernote粘过来的格式还是乱了,文末附上格式良好的原文截图 ...

Cloudera Manager 5 和 CDH5 本地(离线)安装指南(Hadoop集群搭建)(转载)

 6条回复 转载请注明出处:http://www.wangyongkui.com/hadoop-cdh5。 系统环境 4台联想R510服务器,其中master节点4核心...

Cloudera CDH5 Hadoop集群的搭建

hadoop集群CDH5.2.0搭建

cloudera CDH5 Hadoop集群全套安装部署流程

本文详细地写了如何用virtualbox虚拟机虚拟出两个节点并搭建Hadoop集群。 借助cloudera manager完成集群的搭建。 包括虚拟机安装Linux后的配置和克隆虚拟机的网卡配置, 时...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)