hadoop 2.8.1 + zookeeper 3.4.6 + yarn 高可用集群搭建记录

最新推荐文章于 2021-01-14 00:15:37 发布

置顶犀利哗啦760596103

最新推荐文章于 2021-01-14 00:15:37 发布

阅读量276

点赞数 1

分类专栏： hadoop zookeeper yarn 集群大数据文章标签： hadoop yarn zookeeper 大数据集群

本文链接：https://blog.csdn.net/liuhuabing760596103/article/details/88991400

版权

集群同时被 3 个专栏收录

3 篇文章 0 订阅

订阅专栏

zookeeper

2 篇文章 0 订阅

订阅专栏

hadoop

1 篇文章 0 订阅

订阅专栏

简单集群介绍

1. hadoop 所在机器

namenode active hdp01

namenode standby hdp02

datanode hdp03 、 hdp04、 hdp05、 hdp06、 hdp07、 hdp08

2.zookeeper 所在机器

一般选举机制的集群节点都是奇数个偶数的话，集群down掉的话，多那么一台机器没有什么作用

比如 5个节点跟6个节点同样是3个节点down掉整个集群就down掉了，多一台机器浪费资源

hdp04、 hdp05、 hdp06、 hdp07、 hdp08

3.yarn 高可用

hdp03 hdp04

搭建步骤

1.搭建zookeeper集群（hdp04）
1.1解压
tar -zxvf zookeeper-3.4.6.tar.gz -C /home/hadoop/app/
1.2修改配置
           cd /home/hadoop/app/zookeeper-3.4.6/conf/
           cp zoo_sample.cfg zoo.cfg
           vim zoo.cfg
           修改：dataDir=/home/hadoop/app/zookeeper-3.4.6/tmp
           在最后添加：
           server.1=hadoop04:2888:3888
           server.2=hadoop05:2888:3888
           server.3=hadoop06:2888:3888
           server.4=hadoop07:2888:3888
           server.5=hadoop08:2888:3888
           保存退出
           然后创建一个tmp文件夹
           mkdir /home/hadoop/app/zookeeper-3.4.6/tmp
           echo 1 > /home/hadoop/app/zookeeper-3.4.6/tmp/myid
1.3将配置好的zookeeper拷贝到其他节点
注意：修改hadoop05、hadoop06、hadoop07、hadoop08对应/hadoop/zookeeper-3.4.6/tmp/myid内容
hadoop05：
echo 2 > /home/hadoop/app/zookeeper-3.4.6/tmp/myid
hadoop06：
echo 3 > /home/hadoop/app/zookeeper-3.4.6/tmp/myid

hadoop07：
echo 4 > /home/hadoop/app/zookeeper-3.4.6/tmp/myid
hadoop08：
echo 5 > /home/hadoop/app/zookeeper-3.4.6/tmp/myid

2.搭建hadoop集群（hdp01）

     2.1 解压
tar -zxvf hadoop-2.6.4.tar.gz -C /home/hadoop/app/
2.2 配置HDFS（hadoop2.0所有的配置文件都在$HADOOP_HOME/etc/hadoop目录下）
#将hadoop添加到环境变量中
vim /etc/profile
export JAVA_HOME=/usr/java/jdk1.8.0_11
export HADOOP_HOME=/hadoop/hadoop-2.8.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

           #hadoop2.0的配置文件全部在$HADOOP_HOME/etc/hadoop下
cd /home/hadoop/app/hadoop-2.8.1/etc/hadoop

           2.2.1修改hadoo-env.sh
               export JAVA_HOME=/home/hadoop/app/jdk1.8.0_11

2.2.2 修改相关配置文件

* 修改core-site.xml

<configuration>

<property>
<name>fs.defaultFS</name>
<value>hdfs://hdps</value>
</property>

<property>
<name>hadoop.tmp.dir</name>
<value>/root/hdptmp/</value>
</property>

<property>
<name>ha.zookeeper.quorum</name>
<value>hdp04:2181,hdp05:2181,hdp06:2181,hdp07:2181,hdp08:2181</value>
</property>
</configuration>

* 修改hdfs-site.xml

<configuration>

<property>
<name>dfs.nameservices</name>
<value>hdps</value>
</property>

<property>
<name>dfs.ha.namenodes.hdps</name>
<value>nn1,nn2</value>
</property>

<property>
<name>dfs.namenode.rpc-address.hdps.nn1</name>
<value>hdp01:9000</value>
</property>

<property>
<name>dfs.namenode.http-address.hdps.nn1</name>
<value>hdp01:50070</value>
</property>

<property>
<name>dfs.namenode.rpc-address.hdps.nn2</name>
<value>hdp02:9000</value>
</property>

<property>
<name>dfs.namenode.http-address.hdps.nn2</name>
<value>hdp02:50070</value>
</property>

<property>
<name>dfs.namenode.name.dir</name>
<value>/root/hdpdata/name</value>
</property>

<property>
<name>dfs.datanode.data.dir</name>
<value>/root/hdpdata/data</value>
</property>

<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hdp04:8485;hdp05:8485;hdp06:8485/hdp21;hdp07:8485/hdp21;hdp08:8485/hdps</value>
</property>

<property>
<name>dfs.journalnode.edits.dir</name>
<value>/root/hdpdata/journaldata</value>
</property>

<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>

<property>
<name>dfs.client.failover.proxy.provider.hdps</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>

<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>

* 修改mapred-site.xml
<configuration>

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

* 修改yarn-site.xml
<configuration>

<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>

<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>

<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>

<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>hdp03</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>hdp04</value>
</property>

<property>
<name>yarn.resourcemanager.zk-address</name>
<value>hdp04:2181,hdp05:2181,hdp06:2181,hdp07:2181,hdp08:2181</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>