0549-6.1-如何在SUSE12 SP3安装CDH6.1

基础设施

2.1

硬件配置

机器名称系统版本配置用途
gdodsdcs2(128.18.9.209)SLES12 SP3CPU16CoresCM节点
内存32GB
硬盘80GB(raid1,安装操作系统)100GB \* 1 数据盘
gdodsspark1(128.18.9.202)SLES12 SP3CPU56CoresMaster节点兼数据节点
内存356GB
硬盘280GB(安装操作系统)1.5TB \* 6数据盘(SAT)1.1TB \* 1数据盘(SSD)1.7TB \* 1数据盘(SSD)
gdodsspark2(128.18.9.203)SLES12 SP3CPU56CoresMaster节点兼数据节点
内存356GB
硬盘280GB(安装操作系统)1.5TB \* 6数据盘(SAT)1.1TB \* 1数据盘(SSD)1.7TB \* 1数据盘(SSD)
Gdodsspark[3-6](128.18.9.20[4-7])SLES12 SP3CPU56CoresDataNode节点
内存356GB
硬盘280GB(安装操作系统)1.5TB \* 6数据盘(SAT)1.1TB \* 1数据盘(SSD)1.7TB \* 1数据盘(SSD)

2.2

软件环境

操作系统SLES12 SP3
CM6.1.0
JDK1.8.0_141
CDH6.1.0
Hadoop3.0.0
Hive2.1.1
Spark2.4.0
Zookeeper3.4.5
sqoop1.4.7
Postgresql9.6.10

2.3

角色部署

类型IP地址安装服务
管理节点1128.18.9.209Cloudera Manager、Cloudera Manager Service
管理节点2128.18.9.202NameNode(Standby)、JournalNode、FailoverController、Zookeeper、ResourceManager(Active)、 JournalNode、Zookeeper、Balancer、Hive MetaStore、Gateway、DateNode、Hive Server2、NodeManager、SparkHistory Server
管理节点3128.18.9.203NameNode(Active)、JournalNode、FailoverController、Zookeeper、ResourceManager(Standby)、HiveServer2、Gateway、Hive MetaStore、JobHistory ServerDateNode、NodeManager
数据节点128.18.9.204DataNode、NodeManager、Gateway、JournalNode、Zookeeper
数据节点128.18.9.20[5-7]DataNode、NodeManager、Gateway

2.4

Access UI

Service NameAddressUsername/Password
Cloudera Managerhttp://128.18.9.209:7180admin/admin

2.5

Postgresql

元数据库使用的是外部数据库:Postgresql数据库

Address:128.18.9.208:5432

DatabaseUsernamePasswordRemark
metastorehiveHivePostgresDatabase of Hive metastore
amamAmPostgresDatabase of Activity Monitor
cmcmCmPostgresDatabase of Cloudera Manager
rmrmRmPostgresDatabase of Reports Manager

2.6

数据目录信息

服务角色目录
CMService Monitor/data1/var/lib/ cloudera-service-monitor
Host Monitor/data1/var/lib/cloudera-host-monitor
Event Server/data1/var/lib/cloudera-scm-eventserver
Reports Manager/data1/var/lib/cloudera-scm-headlamp
HDFSNameNode/sdata1/dfs/nn
JournalNode/data1/dfs/jn
Datanode/data1/dfs/dn/data2/dfs/dn/data3/dfs/dn/data4/dfs/dn/data5/dfs/dn/data6/dfs/dn/sdata1/dfs/dn/sdata2/dfs/dn
YARNnodeManager/data1/yarn/nm/data2/yarn/nm/data3/yarn/nm/data4/yarn/nm/data5/yarn/nm/data6/yarn/nm
ZookerperZookerper/data1/var/lib/zookerper

3 集群基本配置及部署安装

因节点之间通过root用户相互ssh的权限被关闭,所以不能使用控制台自动化安装agent,需要手动到所有节点安装agent,并修改相关配置。

3.1

前置准备

以下条件原集群已配置完成:

Hosts文件已配置

Ntp时钟同步

防火墙已关闭

Selinux已关闭

  1. 修改swappiness
echo "vm.swappiness = 1" >> /etc/sysctl.conf
echo 1> /proc/sys/vm/swappiness
  1. 从系统镜像挂载点配置repo

vim /etc/zypp/repos/iso.repo

[iso]
name=iso
enabled=1
autorefresh=0
baseurl=file:///mnt
path=/
type=yast2
keeppackages=0
  1. 安装httpd
zypper install httpd
  1. 利用httpd制作系统镜像本地zypper源
mkdir /srv/www/htdocs/iso
cp /mnt/* /srv/www/htdocs/iso
cd /srv/www/htdocs/iso
zypper install createrepo
createrepo .

在apache2的配置文件中添加该文件夹

vim /etc/apache2/httpd.conf

<Directory "/srv/www/htdocs/iso">
    Option Indexes AllowFollowSymLinks
    AllowOverride None
</Directory>

  1. 利用httpd制作cm本地zypper源和parcel源
mkdir /srv/www/htdocs/cm6.1.0
mkdir /srv/www/htdocs/cdh6.1.0

将cm的安装包上传到cm6.1.0目录下,特别注意的是,SUSE系统还需要下载一个python-psycopg2依赖包上传到cm6.1.0下

cd /srv/www/htdocs/cm6.1.0
createrepo .

在apache2的配置文件中添加这两个文件夹

vim /etc/apache2/httpd.conf

<Directory "/srv/www/htdocs/cm6.1.0">
    Option Indexes AllowFollowSymLinks
    AllowOverride None
</Directory>
<Directory "/srv/www/htdocs/cdh6.1.0">
    Option Indexes AllowFollowSymLinks
    AllowOverride None
</Directory>

  1. 所有节点配置镜像源和cm源

vim /etc/zypp/repos/iso.repo

[iso]
name=iso
enabled=1
autorefresh=0
baseurl=http://128.18.9.202/iso
type=rpm-md
gpgcheck=0

vim /etc/zypp/repos/cm.repo

[cm]
name=cm
enabled=1
autorefresh=0
baseurl=http://128.18.9.202/cm6.1.0
type=rpm-md
gpgcheck=0

3.2

CM节点安装server、agent

  1. 安装jdk1.8
zypper install oracle-j2sdk1.8

  1. 安装cloudera-manager-server、cloudera-manager-agent
zypper install cloudera-manager-server cloudera-manager-agent

  1. 修改agent的配置文件,修改其连接的server主机,log目录以及lib目录
vim /etc/cloudera-scm-agent/config.ini

在数据盘下创建目录

mkdir -p /data1/var/lib
mkdr -p /data1/var/log

将原来的目录移到这两个目录下

mv /var/lib/cloudera-scm-agent /data1/var/lib
mv /var/log/cloudera-scm-agent /data1/var/log

启动agent

systemctl start cloudera-scm-agent
  1. 修改server的启动脚本,配置log目录
vim /opt/cloudera/cm/bin/cm-server

将目录文件移到数据盘上

mv /var/log/cloudera-scm-server /data1/var/log
  1. 初始化cloudera-scm-server的数据库
sh /opt/cloudera/cm/schema/scm_prepare_database.sh -h128.18.9.208 -P5432 postgresql cm cm CmPostgres

  1. 配置postgresql数据库驱动

将驱动上传到httpd节点的/srv/www/htdocs/cdh6.1.0目录下,其他节点通过wget进行拉取

mkdir -p /usr/share/java
cd /usr/share/java
wget http://128.18.9.202/cdh6.1.0/postgresql-42.2.2.jar
ln -s postgresql-42.2.2.jar postgresql-connector-java.jar

  1. 启动server
systemctl start cloudera-scm-server

3.3

其他节点安装agent

剩余节点都需要手动执行以下操作,手动安装agent并修改配置

  1. 安装jdk1.8
zypper install oracle-j2sdk1.8

  1. 安装cloudera-manager-agent
zypper install cloudera-manager-agent

  1. 修改agent的配置文件,修改其连接的server主机,log目录以及lib目录
vim /etc/cloudera-scm-agent/config.ini

在数据盘下创建目录

mkdir -p /sdata1/var/lib
mkdr -p /sdata1/var/log

将原来的目录移到这两个目录下

mv /var/lib/cloudera-scm-agent /sdata1/var/lib
mv /var/log/cloudera-scm-agent /sdata1/var/log
  1. 配置postgresql数据库驱动
mkdir -p /usr/share/java
cd /usr/share/java
wget http://128.18.9.202/cdh6.1.0/postgresql-42.2.2.jar
ln -s postgresql-42.2.2.jar postgresql-connector-java.jar

  1. 启动agent
systemctl start cloudera-scm-agent

3.4

修改数据盘所属用户及权限

由于原来数据盘都是由ods用户挂载,并且权限是700,这将导致root安装集群时无法生成所需目录,最终安装失败

修改这些数据盘目录所属用户为root,所属用户组为root,权限赋予755

chown root:root /data1
chown root:root /data2
chown root:root /data3
chown root:root /data4
chown root:root /data5
chown root:root /data6
chown root:root /sdata1
chown root:root /sdata2
chmod 755 /data1
chmod 755 /data2
chmod 755 /data3
chmod 755 /data4
chmod 755 /data5
chmod 755 /data6
chmod 755 /sdata1
chmod 755 /sdata2

4

控制台安装

  1. 打开http://128.18.9.209:7180,以admin/admin登录

  1. 点“继续”

  1. 勾选同意,点继续

  1. 选择“60天试用版”,点击继续

  1. 点击“继续”

  1. 点击“当前管理主机”,全部勾选,点击“继续”

  1. 点击“更多选项”

  1. 将其他的parcel路径删掉,添加自己制作的parcel包下载路径

  1. 点击继续

  1. 开始下载并分发parcel包,等待下载分发激活完成

  1. 确保下方的主机检查项全部通过,点击“继续”

  1. 点击“自定义服务”,勾选需要的服务

  1. 输入元数据库的信息,测试连接

  1. 配置相关目录

Datenode数据目录暂时默认即可,后期根据不同的节点分配不同的角色组,来分配不同的目录。

Namenode数据目录:

SecondaryNamenode数据目录:

CM服务数据目录:

NodeManager数据目录:

Zookeeper数据目录:

  1. 点击“继续”,等待安装完成。

  1. 配置DataNode目录,先配置角色组,设置Datanode角色为三个组,Datenode Default Group,onlywithzk,withnamenode:

  1. 根据不同的角色来分配datanode目录,以为namenode、zk、journalNode留出独立的数据盘:

5 启用HA

本集群启用了HDFS,YARN的高可用

JournalNode数据目录为:

6

配置组件的log,tmp等目录

7 集群基本配置

7.1

Cloudera Manager

这些服务主要是提供监控功能,目前的调整主要集中在内存放,以便有足够的资源完成集群管理。

服务选项配置值
Activity MonitorJava Heap Size4GB
Service MonitorJava Heap Size4GB
Host MonitorJava Heap Size4GB
Event ServerJava Heap Size4GB
Alert PublisherJava Heap Size2GB
Reports ManagerJava Heap Size4GB

7.2

HDFS配置

服务选项配置值
NameNodeJava Heap Size4GB
dfs.namenode.handler.countNameNode处理程序计数54
dfs.datanode.fsdataset.volume.choosing.policyDataNode 卷选择策略Round Robin
dfs.namenode.avoid.read.stale.datanode避免读取失效 DataNodefalse
dfs.namenode.write.stale.datanode.ratio写入失效 DataNode 比率0.5
dfs.namenode.safemode.threshold-pctSafemode 阈值百分比0.999
dfs.umaskmode默认值 Umask022
DataNodeJava Heap Size1GB
dfs.datanode.handler.countDataNode处理程序计数3
dfs.datanode.max.xcieversDataNode最大传输线程数4096
JournalNodeJava Heap Size1GB
Failover ControllerJava Heap Size512MB

7.3

YARN配置

服务选项配置值
ResourceManagerJava Heap Size4GB
yarn.scheduler.minimum-allocation-mb最小容器内存1GB
yarn.scheduler.increment-allocation-mb容器增量内存512MB
yarn.scheduler.maximum-allocation-mb最大容器内存230GB
yarn.scheduler.minimum-allocation-vcores最小容器虚拟内核1
yarn.scheduler.increment-allocation-vcores容器虚拟内核增量1
yarn.scheduler.maximum-allocation-vcores最大容器虚拟内核56
yarn.resourcemanager.recovery.enabled启用 ResourceManager Recoveryfalse
NodeManagerJava Heap Size1GB
yarn.nodemanager.resource.memory-mb容器内存230GB
yarn.nodemanager.resource.cpu-vcores容器虚拟内核数量56
yarn.nodemanager.remote-app-log-dir删除应用程序日志目录/tmp/logs
Gatewaymapreduce.map.memory.mbMap 任务内存2GB
mapreduce.reduce.memory.mbReduce 任务内存4GB
yarn.app.mapreduce.am.resource.mbApplicationMaster 内存1GB

7.4

Zookeeper配置

服务选项配置值
ZookeepermaxClientCnxns最大客户端连接数180
Java Heap Size1GB
maxSessionTimeout最大会话超时120000

7.5

Hive配置

服务选项配置值
HiveServer2Java Heap Size4GB
Hive MetaStoreJava Heap Size8GB
Hive GatewayJava Heap Size2GB
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值