【HadoopHA】HadoopHA集群的部署（YarnHA NamenodeHA）

最新推荐文章于 2022-12-01 05:57:25 发布

没去过埃及的法老

最新推荐文章于 2022-12-01 05:57:25 发布

阅读量193

点赞数

分类专栏： HadoopHA 文章标签： YarnHA hadoop NamenodeHA HadoopHA 大数据

本文链接：https://blog.csdn.net/qq_41369191/article/details/106026179

版权

HadoopHA 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

准备环境

1.修改Linux主机名

2.修改IP

3.修改主机名和IP的映射关系 /etc/hosts

4.关闭防火墙

5.ssh免登陆

6.安装JDK，配置环境变量等

7.注意集群时间要同步

8.配置zooekeeper集群

集群部署节点角色的规划（3节点）

node01 namenode resourcemanager zkfc nodemanager datanode zookeeper journal node

node02 namenode resourcemanager zkfc nodemanager datanode zookeeper journal node

node03 datanode nodemanager zookeeper journal node

安装配置hadoop集群

解压

tar -zxvf ./hadoop-2.6.0-cdh5.14.0.tar.gz -C ../servers/

将hadoop添加到环境变量中

vim /etc/profile.d/hadoop.sh   
export HADOOP_HOME=/export/servers/hadoop-2.6.0-cdh5.14.0
export PATH=:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

配置生效

source /etc/profile

修改hadoop-env.sh

vim /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/hadoop-env.sh
export JAVA_HOME=${JAVA_HOME}

修改core-site.xml

<configuration>
<!-- 集群名称在这里指定！该值来自于hdfs-site.xml中的配置 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster1</value>
</property>
<!-- 这里的路径默认是NameNode、DataNode、JournalNode等存放数据的公共目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/export/servers/hadoop-2.6.0-cdh5.14.0/HAhadoopDatas/tmp</value>
</property>

<!-- ZooKeeper集群的地址和端口。注意，数量一定是奇数，且不少于三个节点-->
<property>
<name>ha.zookeeper.quorum</name>
<value>node01:2181,node02:2181,node03:2181</value>
</property>
</configuration>

修改hdfs-site.xml

<configuration>
<!--指定hdfs的nameservice为cluster1，需要和core-site.xml中的保持一致 -->
<property>
<name>dfs.nameservices</name>
<value>cluster1</value>
</property>
<!-- cluster1下面有两个NameNode，分别是nn1，nn2 -->
<property>
<name>dfs.ha.namenodes.cluster1</name>
<value>nn1,nn2</value>
</property>
<!-- nn1的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.cluster1.nn1</name>
<value>node01:8020</value>
</property>
<!-- nn1的http通信地址 -->
<property>
<name>dfs.namenode.http-address.cluster1.nn1</name>
<value>node01:50070</value>
</property>
<!-- nn2的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.cluster1.nn2</name>
<value>node02:8020</value>
</property>
<!-- nn2的http通信地址 -->
<property>
<name>dfs.namenode.http-address.cluster1.nn2</name>
<value>node02:50070</value>
</property>
<!-- 指定NameNode的edits元数据在JournalNode上的存放位置 -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://node01:8485;node02:8485;node03:8485/cluster1</value>
</property>
<!-- 指定JournalNode在本地磁盘存放数据的位置 -->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/export/servers/hadoop-2.6.0-cdh5.14.0/journaldata</value>
</property>
<!-- 开启NameNode失败自动切换 -->
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<!-- 指定该集群出故障时，哪个实现类负责执行故障切换 -->
<property>
<name>dfs.client.failover.proxy.provider.cluster1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!-- 配置隔离机制方法，多个机制用换行分割，即每个机制暂用一行-->
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
</value>
</property>
<!-- 使用sshfence隔离机制时需要ssh免登陆 -->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
<!-- 配置sshfence隔离机制超时时间 -->
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>

修改mapred-site.xml

<configuration>
<!-- 指定mr框架为yarn方式 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

修改yarn-site.xml

<configuration>
<!-- 开启RM高可用 -->
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<!-- 指定RM的cluster id -->
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>
<!-- 指定RM的名字 -->
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<!-- 分别指定RM的地址 -->
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>node01</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>node02</value>
</property>
<!-- 指定zk集群地址 -->
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>node01:2181,node02:2181,node03:2181</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

修改slaves

node01
node02
node03

将软件拷贝到所有节点

scp -r /export/servers/hadoop-2.6.0-cdh5.14.0  node02:$PWD
scp -r /export/servers/hadoop-2.6.0-cdh5.14.0  node03:$PWD

配置免密码登陆

要配置node01到node01、node02、node03 的免密码登陆（node01）

ssh-keygen  
ssh-coyp-id node01
ssh-coyp-id node02
ssh-coyp-id node03

两个namenode之间要配置ssh免密码登陆 ssh远程补刀时候需要（node02）

ssh-keygen 
ssh-coyp-id node01

启动zookeeper集群

分别在node01、node02、node03上启动zk

cd /export/servers/zookeeper-3.4.5-cdh5.14.0/bin/
./zkServer.sh start

手动启动journalnode

分别在在node01、node02、node03上执行

cd /export/servers/hadoop-2.6.0-cdh5.14.0/sbin
hadoop-daemon.sh start journalnode

格式化namenode

在node01上执行命令

格式化后会在根据core-site.xml中的hadoop.tmp.dir配置的目录下生成个hdfs初始化文件

hdfs namenode -format

把hadoop.tmp.dir配置的目录下所有文件拷贝到另一台namenode节点所在的机器

cd /export/servers/hadoop-2.6.0-cdh5.14.0
scp -r ./HAhadoopDatas node02:$PWD

格式化ZKF(在active上执行即可)

hdfs zkfc -f

启动HDFS(在node01上执行)

start-dfs.sh

启动YARN

在active节点上启动

start-yarn.sh

在standby节点上手动启动备份的resourcemanager

yarn-daemon.sh start resourcemanager

浏览器访问

NameNode (active) ：http://192.168.100.201:50070/dfshealth.html#tab-overview

NameNode (standby) ：http://192.168.100.202:50070/dfshealth.html#tab-overview

ResourceManager (active) ：http://192.168.100.201:8088/cluster/cluster

没去过埃及的法老

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录