hadoop3.1.3集群搭建(ha+yarn)

最新推荐文章于 2023-11-21 10:50:24 发布

get it now

最新推荐文章于 2023-11-21 10:50:24 发布

阅读量1.7k

点赞数

分类专栏： hadoop 大数据技术

本文链接：https://blog.csdn.net/lxhjava/article/details/104331765

版权

大数据技术同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

hadoop

3 篇文章 0 订阅

订阅专栏

当前环境：

centos6.5,jdk8

准备工作：

1.服务器之间免密登录

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
$ chmod 0600 ~/.ssh/authorized_keys

2.服务器之间时间同步

3.安装zookeeper集群

搭建步骤：

1.下载apache hadoop3.1.3并上传至服务器解压

https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gz

2.环境变量设置：

export BASE_DIR=/data/br
export JAVA_HOME=$BASE_DIR/base/jdk1.8.0_181
export HADOOP_HOME=$BASE_DIR/base/hadoop
export ZOOKEEPER_HOME=/data/br/base/zookeeper

export HDFS_JOURNALNODE_USER=root
export HDFS_ZKFC_USER=root
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_NODEMANAGER_USER=root
export YARN_RESOURCEMANAGER_USER=root

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin:$KAFKA_HOME/bin

3.hadoop-env.sh设置

export JAVA_HOME=/data/br/base/jdk1.8.0_181

4.core-site.xml配置

<configuration>
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://mycluster</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/data/br/cache/hadoop/ha</value>
  </property>
  <!-- 指定每个zookeeper服务器的位置和客户端端口号 -->
  <property>
     <name>ha.zookeeper.quorum</name>
     <value>bonree01:2181,bonree02:2181,bonree03:2181</value>
   </property>
</configuration>

5.hdfs-site.xml配置

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>2</value>
  </property>
  <property>
    <name>dfs.nameservices</name>
    <value>mycluster</value>
  </property>
  <property>
    <name>dfs.ha.namenodes.mycluster</name>
    <value>nn1,nn2</value>
  </property>
  <property>
    <name>dfs.namenode.rpc-address.mycluster.nn1</name>
    <value>bonree01:8020</value>
  </property>
  <property>
    <name>dfs.namenode.rpc-address.mycluster.nn2</name>
    <value>bonree02:8020</value>
  </property>
  <property>
    <name>dfs.namenode.shared.edits.dir</name>
    <value>qjournal://bonree01:8485;bonree02:8485;bonree03:8485/mycluster</value>
  </property>
  <property>
    <name>dfs.client.failover.proxy.provider.mycluster</name>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  </property>
  <property>
    <name>dfs.ha.fencing.methods</name>
    <value>sshfence</value>
  </property>
  <property>
    <name>dfs.ha.fencing.ssh.private-key-files</name>
    <value>/root/.ssh/id_dsa</value>
  </property>
  <property>
    <name>dfs.ha.automatic-failover.enabled</name>
    <value>true</value>
  </property>
</configuration>

6.mapred-site.xml设置

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
  <property>
        <name>mapreduce.application.classpath</name>
        <value>$HADOOP_HOME/share/hadoop/mapreduce/*:$HADOOP_HOME/share/hadoop/mapreduce/lib/*</value>
    </property>
</configuration>

7.yarn-site.xml配置

<configuration>

<!-- Site specific YARN configuration properties -->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
<property>
    <name>yarn.nodemanager.env-whitelist</name>
    <value>JAVA_HOME,HADOOP_HOME</value>
</property>
<!--启用ResourceManager的高可用-->
<property>
  <name>yarn.resourcemanager.ha.enabled</name>
  <value>true</value>
</property>
<!--指代ResourceManager HA的两台RM的逻辑名称 -->
<property>
  <name>yarn.resourcemanager.cluster-id</name>
  <value>rmhacluster1</value>
</property>
<!--指定该高可用ResourceManager下的两台ResourceManager的逻辑名称-->
<property>
  <name>yarn.resourcemanager.ha.rm-ids</name>
  <value>rm1,rm2</value>
</property>
<!--指定第一台ResourceManager服务器所在的主机名称 -->
<property>
  <name>yarn.resourcemanager.hostname.rm1</name>
  <value>bonree02</value>
</property>
<property>
  <name>yarn.resourcemanager.hostname.rm2</name>
  <value>bonree03</value>
</property>
<!--指定resourcemanager的web服务器的主机名和端口号-->
<property>
  <name>yarn.resourcemanager.webapp.address.rm1</name>
  <value>bonree02:8088</value>
</property>
<property>
  <name>yarn.resourcemanager.webapp.address.rm2</name>
  <value>bonree03:8088</value>
</property>
<!--做ResourceManager HA故障切换用到的zookeeper集群地址 -->
<property>
  <name>yarn.resourcemanager.zk-address</name>
  <value>bonree01:2181,bonree02:2181,bonree03:2181</value>
</property>
</configuration>

8.works指定datanode

bonree01
bonree02
bonree03

以上配置拷贝到所有集群上，配置完成，若需要添加其他配置参数，参考官网：https://hadoop.apache.org/docs/r3.1.3/hadoop-project-dist/hadoop-common/ClusterSetup.html

二、格式化相关操作（前提zookeeper集群已启动）

1.在指定的所有journalnode机器上执行命令启动journalnode

hdfs --daemon start journalnode

2.在某台机器上执行namenode格式化（zk进程所在节点）

hdfs namenode -format

3.在所在某一台namenode机器执行，启动namenode

hdfs --daemon start namenode

4.在其余namenode机器上执行，同步active namenode信息，作为secondarynamenode

hdfs namenode -bootstrapStandby

5.在active namenode所在节点执行，初始化zookeeper上NameNode的状态

hdfs zkfc -formatZK

6.start-dfs.sh 启动ha，在指定的resource manager所在机器上执行start-yarn.sh启动resourcemanager、nodemanager

再次检查每台机器进程是否都正常运行，搭建完成。

hdfs web url：http://bonree01:9870,

resourcemanager web url：http://bonree02:8088

说明：搭建说明及配置简陋，仅保证能正常运行。仅供参考。

get it now

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
hadoop3.1.3集群搭建(ha+yarn)

当前环境：centos6.5,jdk8准备工作：1.服务器之间免密登录$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys$ chmod 0600 ~/.ssh/authorized_keys2.服务器之间时间同步3.安装zook...
复制链接

扫一扫