Hadoop的HA的安装配置

最新推荐文章于 2024-08-26 16:26:51 发布

Jantelope

最新推荐文章于 2024-08-26 16:26:51 发布

阅读量477

点赞数

分类专栏：软件安装文章标签： Hadoop的HA安装配置

本文链接：https://blog.csdn.net/Jantelope/article/details/80713695

版权

软件安装专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一、集群的规划
Zookeeper集群：
192.168.43.112 （bigdata112）
192.168.43.113 （bigdata113）
192.168.43.114 （bigdata114）

Hadoop集群：
192.168.43.112 （bigdata112） NameNode1 ResourceManager1 Journalnode
192.168.43.113 （bigdata113） NameNode2 ResourceManager2 Journalnode
192.168.43.114 （bigdata114） DataNode1 NodeManager1

192.168.43.115 （bigdata115） DataNode2 NodeManager2

备注：Journalnode替代NameNode来维护数据块的源信息

二、准备工作
1、安装JDK
2、配置环境变量
java的环境变量配置:
JAVA_HOME=/root/training/jdk1.8.0_144
export JAVA_HOME

PATH=$JAVA_HOME/bin:$PATH
export PATH

Hadoop的环境变量配置：
HADOOP_HOME=/root/training/hadoop-2.7.3
export HADOOP_HOME

PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export PATH

3、配置免密码登录
查看之前的文章，配置免密码登录
4、配置主机名
5、解压hadoop-2.7.3.tar.gz 在home目录下创建两个文件夹
（*）mkdir /root/training/hadoop-2.7.3/tmp
（*）mkdir /root/training/hadoop-2.7.3/journal

三、配置Zookeeper（在192.168.43.112安装）备注：可查看之前的zookeeper的集群安装
在主节点（bigdata112）上配置ZooKeeper
（*）配置/root/training/zookeeper-3.4.6/conf/zoo.cfg文件
dataDir=/root/training/zookeeper-3.4.6/tmp

server.1=bigdata112:2888:3888
server.2=bigdata113:2888:3888
server.3=bigdata114:2888:3888

（*）在/root/training/zookeeper-3.4.6/tmp目录下创建一个myid的空文件
echo 1 > /root/training/zookeeper-3.4.6/tmp/myid

（*）将配置好的zookeeper拷贝到其他节点，同时修改各自的myid文件
scp -r /root/training/zookeeper-3.4.6/ bigdata113:/root/training
scp -r /root/training/zookeeper-3.4.6/ bigdata114:/root/training

四、安装Hadoop集群（在bigdata112上安装）
1、修改hadoo-env.sh
export JAVA_HOME=/root/training/jdk1.8.0_144

2、修改core-site.xml
<configuration>

<property>
<name>fs.defaultFS</name>
<value>hdfs://ns1</value>
</property>


<property>
<name>hadoop.tmp.dir</name>
<value>/root/training/hadoop-2.7.3/tmp</value>
</property>


<property>
<name>ha.zookeeper.quorum</name>
<value>bigdata112:2181,bigdata113:2181,bigdata114:2181</value>
</property>
</configuration>

3、修改hdfs-site.xml（配置这个nameservice中有几个namenode）
<configuration>

<property>
<name>dfs.nameservices</name>
<value>ns1</value>
</property>


<property>
<name>dfs.ha.namenodes.ns1</name>
<value>nn1,nn2</value>
</property>


<property>
<name>dfs.namenode.rpc-address.ns1.nn1</name>
<value>bigdata112:9000</value>
</property>

<property>
<name>dfs.namenode.http-address.ns1.nn1</name>
<value>bigdata112:50070</value>
</property>


<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>bigdata113:9000</value>
</property>

<property>
<name>dfs.namenode.http-address.ns1.nn2</name>
<value>bigdata113:50070</value>
</property>


<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://bigdata112:8485;bigdata113:8485;/ns1</value>
</property>

<property>
<name>dfs.journalnode.edits.dir</name>
<value>/root/training/hadoop-2.7.3/journal</value>
</property>


<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>


<property>
<name>dfs.client.failover.proxy.provider.ns1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>


<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>


<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>


<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>

4、修改mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

5、修改yarn-site.xml
<configuration>

<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>


<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>


<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>


<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>bigdata112</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>bigdata113</value>
</property>


<property>
<name>yarn.resourcemanager.zk-address</name>
<value>bigdata112:2181,bigdata113:2181,bigdata114:2181</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

6、修改slaves
bigdata114
bigdata115

7、将配置好的hadoop拷贝到其他节点
scp -r /root/training/hadoop-2.7.3/ root@bigdata113:/root/training/
scp -r /root/training/hadoop-2.7.3/ root@bigdata114:/root/training/
scp -r /root/training/hadoop-2.7.3/ root@bigdata115:/root/training/

五、启动Zookeeper集群
zkServer.sh start 三台服务器都要启动

六、在bigdata112和bigdata113上启动journalnode
hadoop-daemon.sh start journalnode

七、格式化HDFS（在bigdata112上执行）
1. hdfs namenode -format
2. 将/root/training/hadoop-2.7.3/tmp拷贝到bigdata113的/root/training/hadoop-2.7.3/tmp下
scp -r dfs/ root@bigdata113:/root/training/hadoop-2.7.3/tmp
3. 格式化zookeeper
hdfs zkfc -formatZK
日志：17/07/13 00:34:33 INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/ns1 in ZK.

八、在bigdata112上启动Hadoop集群
start-all.sh

日志：
Starting namenodes on [bigdata112 bigdata113]
bigdata112: starting namenode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-namenode-hadoop113.out
bigdata113: starting namenode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-namenode-hadoop112.out
bigdata114: starting datanode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-datanode-hadoop115.out
bigdata115: starting datanode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-datanode-hadoop114.out

bigdata113: starting zkfc, logging to /root/training/hadoop-2.7.3/logs/hadoop-root-zkfc-bigdata113.out
bigdata112: starting zkfc, logging to /root/training/hadoop-2.7.3/logs/hadoop-root-zkfc-bigdata112.out

bigdata113上的ResourceManager需要单独启动

命令：yarn-daemon.sh start resourcemanager

备注：HA要求的这些机器需要时间同步