CDH简单了解

简介

hadoop是一个开源项目,所以很多公司在这个基础进行商业化,Cloudera对hadoop做了相应的改变。

Cloudera公司的发行版,我们将该版本称为CDH(Cloudera Distribution Hadoop)。

CDH 6.2.1 包含组件
ComponentComponent Version
Apache Flume1.9.0
Apache Hadoop3.0.0
Apache HBase2.1.2
Apache Hive2.1.1
Apache Kafka2.1.0
Apache Oozie5.1.0
Apache Spark2.4.0
Apache Sqoop1.4.7
Apache ZooKeeper3.4.5
详见:https://docs.cloudera.com/documentation/enterprise/6/release-notes/topics/rg_cdh_6_version_packaging_download.html

CDH优点

  1. 版本划分清晰
  2. 版本更新速度快
  3. 支持Kerberos安全认证
  4. 文档清晰
  5. 支持多种安装方式(Cloudera Manager方式)

同类产品对比

CDH与Apache版本Hadoop
Apache Hadoop 不足之处:
  1. 版本管理混乱
  2. 部署过程繁琐、升级过程复杂
  3. 兼容性差
  4. 安全性低

对于国内而言,绝大多数公司选择CDH版本

但是自 2021 年 1 月 31 日开始,所有 Cloudera 软件都需要订阅(付费)。也就是说打算免费使用的话, 安装部署/升级维护就比较麻烦了, 详见:

https://www.clouderacn.cn/downloads/paywall-expansion.html#

另外从学习/测试的方面来说, 一方面CDH使用的最小内存要比Hadoop大很多, 另一方面CDH开始收费, 找安装包资源也比较费劲, 所以Apache版本的Hadoop更适合学习测试

安装部署使用(待补充)

使用
CDH 中常用的文件目录
/var/log/cloudera-scm-installer : 安装日志目录。
/var/log/* : 相关日志文件(相关服务的及CM的)。
/usr/share/cmf/ : 程序安装目录。
/usr/lib64/cmf/ : Agent程序代码。
/var/lib/cloudera-scm-server-db/data : 内嵌数据库目录。
/usr/bin/postgres : 内嵌数据库程序。
/etc/cloudera-scm-agent/ : agent的配置目录。
/etc/cloudera-scm-server/ : server的配置目录。
/opt/cloudera/parcels/ : Hadoop相关服务安装目录。
/opt/cloudera/parcel-repo/ : 下载的服务软件包数据,数据格式为parcels。
/opt/cloudera/parcel-cache/ : 下载的服务软件包缓存数据。
/etc/hadoop/* : 客户端配置文件目录。
CDH 6 常用端口
  • ClouderaManager:7180
  • NameNode:9870
  • DataNode:9864
  • Yarn-ResourceManager:8088
  • Yarn-NodeManager:8042
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值