CDH6.3.x搭建
安装前基础环境准备
本人使用的各组件版本如下:
操作系统版本:centos7
CM版本:6.3.1
CDH版本:6.3.2(5.16.2版本实测也可以)
JDK版本:openjdk version “1.8.0_262”
服务器配置:
服务器 | CPU | 内存 | 磁盘 |
---|---|---|---|
cmserver | 8核 | 24G | /home/app 挂载300G |
master01 | 4核 | 24G | /home/app 挂载300G |
master02 | 4核 | 24G | /home/app 挂载300G |
slave01 | 4核 | 24G | /home/hdfsdata/data1 挂载100T |
slave02 | 4核 | 24G | /home/hdfsdata/data1 挂载100T |
slave03 | 4核 | 24G | /home/hdfsdata/data1 挂载100T |
安装包百度云下载地址:
安装前须知:
本博客是根据官方文档的安装教程整理而成的,有不清楚的地方建议多加阅读官方文档!
CDH6.3官方文档
版本选择
CDH6操作系统版本兼容性对照官方文档
CDH6.3.x与操作系统版本选择对应关系表:
Cloudera Manager和CDH版本对应
Cloudera使用主版本和次版本来管理软件间的依赖,版本号规则为:<主版本>.<次版本>.<维护版本>。版本兼容规则是:Cloudera Manager <主要>.<次要>版本必须等于或大于CDH <主要>.<次要>版本。因此Cloudera Manager6.3.1和CDH6.3.2是可以互相兼容的。
如果是用于实际的生产环境,需要留意CDH对服务器硬件的最低要求,相关详细要求可以参考官方文档:
生产环境硬件要求官方文档
CDH6.x数据库版本要求官方文档
我用的数据库是MySQL,CDH6对MySQL版本要求对照表:
CDH6对JDK版本要求官方文档
CDH6对JDK版本要求对照表:
注意:很多JDK版本都和CDH存在兼容性问题!具体原因查看以上的 CDH6对JDK版本要求官方文档。官网上推荐OpenJDK1.8u211和1.8u181的版本:
其余网络和安全性、操作系统用户权限等要求可查阅官方文档。
Cloudera Manager空间规划
Cloudera Management Service - Activity Monitor 配置
活动监视器仅监视MapReduce作业,默认储存14天的MapReduce活动监视数据,数据量大小取决于集群大小和MapReduce的使用频率会有很大的差异,可参考官方并根据自己集群的实际情况分配Activity Monitor的空间大小;
Cloudera Management Service - Service Monitor 配置
Service Monitor默认存储位置为 /var/lib/cloudera-service-monitor/ ,存储空间不低于12G(服务时间序列存储10G+Impala查询存储1G+YARN应用程序存储1G);
Cloudera Management Service - Host Monitor 配置
Host Monitor默认存储位置为 /var/lib/cloudera-host-monitor/ ,存储空间不低于10 G,用于存放主机时间序列数据;
Cloudera Management Service - Event Server 配置
Event Server默认存储位置为 /var/lib/cloudera-scm-eventserver/ ,默认保留5,000,000个事件,官网没有推荐的存储空间最小值,可通过修改默认保留的事件数控制存储大小;
安装openjdk
注意必须安装openjdk,Cloudera不支持Sun JDK!!!
# 查看jdk1.8版本
yum --showduplicate list java* | grep 1.8.0
# 安装openjdk1.8.0.262版本的jre,命令格式:yum install -y java-1.8.0-openjdk-<version>.x86_64
# version 参数为上面查看jdk版本信息打印出来的版本号
# yum install -y java-1.8.0-openjdk-1.8.0.262.b10-1.el7.x86_64
# 安装jre,会自动安装1.8版本下的最新版本号,我安装的是
sudo yum -y install java-1.8.0-openjdk
# 安装jdk,会自动安装1.8版本下的最新版本号
sudo yum -y install java-1.8.0-openjdk-devel
# 查看jre安装版本
java -version
# 查看jdk安装版本
javac -version
# 配置环境变量
vim /etc/profile
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.262.b10-0.el7_8.x86_64
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin
# 修改后生效环境变量
source /etc/profile
修改系统配置
- 修改所有服务器的hosts和hostname,必须保证集群服务器的hostname是唯一的,以便于集群之间互相通信能找到对应的服务器,并且主机名的格式必须是FQDN(fully qualified domain name)!必须是!官方文档上面也强调了这一点! 网上有很多教程的主机名就设为master01,slave01之类的,我不知道他们是怎么安装成功的,反正我安装agent的时候cm server 一直无法接收agent的检测信号!!!
# 修改绑定的host,格式:ip 域名 主机名
# vim /etc/hosts
10.0.xx.xx0 cmserver.xx0.com.cn cmserver
10.0.xx.xx1 master01.xx1.com.cn master01
10.0.xx.xx2 master02.xx2.com.cn master02
10.0.xx.xx3 slave01.xx3.com.cn slave01
10.0.xx.