最近遇到一个需求:要使用azkaban对接客户的CDH集群,CDH用的是oozie,azkaban只能部署在我们客户端的机器上,所以需要在客户机上手动搭建CDH的hadoop环境。操作很简单,过程比较麻烦,这里记录一下。
文章目录
一 获取所需CDH rpm包
1. 搭建本地CDH package仓库
说明:CDH有两种本地仓库配置方式,package和parcel。官方是推荐使用package,我推荐两种都配置好,CDH还是用parcel。package方式可用于获取rpm包。
https://docs.cloudera.com/documentation/enterprise/6/latest/topics/cm_ig_create_local_package_repo.html
yum包的下载建议使用idm的站点抓取功能,不要用wget下载
2. 使用 yumdownloader 获取rpm包
这一步需要在docker容器环境下进行,这样环境很纯粹,获取到到rpm包更完整,参考:https://blog.csdn.net/alinyua/article/details/108071365
# yum install yum-utils -y
mkdir cdh-packages &&