Hadoop2.X之高可用简介及环境搭建

最新推荐文章于 2022-10-10 17:56:55 发布

瓜不田

最新推荐文章于 2022-10-10 17:56:55 发布

阅读量363

点赞数

CC 4.0 BY-SA版权

分类专栏： BigData

本文链接：https://blog.csdn.net/Jerseywwwwei/article/details/97398927

BigData 专栏收录该内容

19 篇文章

订阅专栏

本文详细介绍了Hadoop2.0高可用性的实现原理及搭建过程，包括HDFS和MapReduce的改进，解决了单点故障和扩展性问题。通过配置多个NameNode和JournalNode，利用Zookeeper实现自动故障转移，确保了系统的稳定性和数据的安全。

Hadoop2.0之高可用

Hadoop2.0产生背景

Hadoop 1.0中HDFS和MapReduce在高可用、扩展性等方面存在问题
HDFS存在的问题(2个)
- NameNode单点故障，难以应用于在线场景 HA（高可用）
- NameNode压力过大，且内存受限，影响扩展性 F（federation，多个NameNode同时工作）
MapReduce存在的问题响系统
- JobTracker访问压力大，影响系统扩展性
- 难以支持除MapReduce之外的计算框架，比如Spark、Storm等

Hadoop 1.x与Hadoop 2.x

在这里插入图片描述

Hadoop 2.x由HDFS、MapReduce和YARN三个分支构成；
- HDFS：NN Federation（联邦）、HA；
  - 2.X:只支持2个节点HA，3.0实现了一主多从
- MapReduce：运行在YARN上的MR；
  - 离线计算，基于磁盘I/O计算
- YARN：资源管理系统•YARN：资源管理系统
HDFS 2.x
- 解决HDFS 1.0中单点故障和内存受限问题。
- 解决单点故障
  - HDFS HA：通过主备NameNode解决
  - 如果主NameNode发生故障，则切换到备NameNode上
- 解决内存受限问题
  - HDFS Federation(联邦)
  - 水平扩展，支持多个NameNode；
  - （Hadoop2）每个NameNode分管一部分目录；
  - （Hadoop1）所有NameNode共享所有DataNode存储资源
- 2.x仅是架构上发生了变化，使用方式不变
- 对HDFS使用者透明
- HDFS 1.x中的命令和API仍可以使用

Hadoop2.0主从架构(HA 高可用机制)

[外链图片转存失败(img-I0nVEOFn-1564134601501)(pic\Hadoop2.0主从架构图.png)]

主备NameNode
解决单点故障（属性，位置）
- 主NameNode对外提供服务，备NameNode同步主NameNode元数据，以待切换
- 所有DataNode同时向两个NameNode汇报数据块信息（位置）
- JNN:集群（属性）
- standby：备，完成了edits.log文件的合并产生新的image，推送回ANN
两种切换选择
- 手动切换：通过命令实现主备之间的切换，可以用HDFS升级等场合
- 自动切换：基于Zookeeper实现
基于Zookeeper自动切换方案(投票选举)
- ZooKeeper Failover Controller：监控NameNode健康状态，
- 并向Zookeeper注册NameNode
- NameNode挂掉后，ZKFC为NameNode竞争锁，获得ZKFC 锁的NameNode变为active

HDFS 2.x Federation

在这里插入图片描述

通过多个Namenode/Namespace把元数据的存储和管理分散到多个节点中，使到Namenode/Namespace可以通过增加机器来进行水平扩展。
能把单个Namenode的负载分散到多个节点中，在HDFS数据规模较大的时候不会也降低HDFS的性能。可以通过多个Namespace来隔离不同类型的应用，把不同类型应用的HDFS元数据的存储和管理分派到不同的Namenode中。

Hadoop高可用搭建

官方文档：http://hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

节点部署

	NN-1	NN-2	DN	ZK	ZKFC	JNN
Node01	*				*	*
Node02		*	*	*	*	*
Node03			*	*		*
Node04			*	*

搭建过程

关闭节点，并用jps进行检验
实现NN01和NN02之间的免密钥操作
- [root@node02 software]# cd /root/.ssh/
- [root@node02 .ssh]# ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
- [root@node02 .ssh]# cat id_dsa.pub >> authorized_keys
- [root@node02 .ssh]# ssh localhost
- [root@node02 ~]# exit
- [root@node02 .ssh]# scp id_dsa.pub node01:`pwd`/node02.pub
- [root@node01 ~]# cd /root/.ssh/
- [root@node01 .ssh]# cat node02.pub >> authorized_keys

在NameNode-1中配置nameservice的逻辑名称

[root@node01 hadoop]# vi hdfs-site.xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    <property>
        <name>dfs.nameservices</name>
        <value>mycluster</value>
     </property>
</configuration>

配置两个NameNode的ID（仅仅是逻辑名称）

    <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2</value>
    </property>

配置两个NameNode的物理地址（为了两者之间的RPC(remote procedure call)）

      <property>
          <name>dfs.namenode.rpc-address.mycluster.nn1</name>
          <value>node01:8020</value>
      </property>
      <property>
          <name>dfs.namenode.rpc-address.mycluster.nn2</name>
          <value>node02:8020</value>
      </property>

配置每个节点的HTTP地址让每个NameNode节点监听相同的RPC地址

	<property>
        <name>dfs.namenode.http-address.mycluster.nn1</name>
        <value>node01:50070</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>node02:50070</value>
    </property>

配置JournalNode的节点分享信息

	<property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://node01:8485;node02:8485;node03:8485/mycluster</value>
    </property>

配置故障转移类，用于在故障转移期间屏蔽Active NameNode

	<property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>        		         <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>

配置私钥文件，在NameNode01挂掉的情况下,NameNode02立即接管，私钥地址要进行更改

	<property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/root/.ssh/id_dsa</value>
    </property>

配置全部配置文件

<configuration>
        <value>mycluster</value>
    </property>
    </property>
        <value>nn1,nn2</value>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>node01:8020</value>
        <value>node01:50070</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>node02:50070</value>
    </property>
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://node1:8485;node2:8485;node3:8485/mycluster</value>
    </property>    
    <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/root/.ssh/id_dsa</value>
    </property>
</configuration>

[root@node01 hadoop]# vi core-site.xml

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/var/sxt/hadoop/ha</value>
    </property>
</configuration>

配置JournalNode[root@node01 hadoop]# vi hdfs-site.xml

	<property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/var/sxt/hadoop/ha/journalnode</value>
    </property>

配置自动故障转移[root@node01 hadoop]# vi hdfs-site.xml

	<property>
   		<name>dfs.ha.automatic-failover.enabled</name>
   		<value>true</value>
 	</property>

配置集群以进行自动故障转移

	<property>
        <name>ha.zookeeper.quorum</name>
        <value>node02:2181,node03:2181,node04:2181</value>
    </property>

将修改完的文件分发到别的节点

[root@node01 hadoop]# scp core-site.xml hdfs-site.xml node02:`pwd`
[root@node01 hadoop]# scp core-site.xml hdfs-site.xml node03:`pwd`
[root@node01 hadoop]# scp core-site.xml hdfs-site.xml node04:`pwd`

在2，3，4节点安装zookeeper，并配置
- [root@node02 software]# tar xf zookeeper-3.4.6.tar.gz -C /opt/sxt/
- [root@node02 sxt]# cd zookeeper-3.4.6/conf
- [root@node02 conf]# mv zoo_sample.cfg zoo.cfg
- [root@node02 conf]# vi zoo.cfg
- dataDir=/var/sxt/zk
- 在末尾添加如下文字，2888指主从节点之间的通信端口号，3888指主挂断之后，产生的选举机制
```
server.1=node02:2888:3888
server.2=node03:2888:3888
server.3=node04:2888:3888
```
- 将配置完的zookeeper分发到node03，node04，先要退到zookeeper的安装目录
  
  [root@node02 sxt]# scp -r zookeeper-3.4.6/ node03:`pwd
  
  [root@node02 sxt]# scp -r zookeeper-3.4.6/ node04:`pwd
- 配置每台服务器的编号
```
[root@node02 zookeeper-3.4.6]# mkdir -p /var/sxt/zk
[root@node02 sxt]# echo 1 > /var/sxt/zk/myid
[root@node02 sxt]# cat /var/sxt/zk/myid 
[root@node03 zookeeper-3.4.6]# mkdir -p /var/sxt/zk
[root@node03 zookeeper-3.4.6]# cd /var/sxt/zk
[root@node03 zk]# echo 2 > /var/sxt/zk/myid
[root@node04 zookeeper-3.4.6]# mkdir -p /var/sxt/zk
[root@node04 zookeeper-3.4.6]# echo 3 > /var/sxt/zk/myid
[root@node04 zookeeper-3.4.6]# cat /var/sxt/zk/myid 
```
- 配置环境变量
  
  [root@node02 zookeeper-3.4.6]# vi + /etc/profile
```
export ZOOKEEPER_HOME=/opt/sxt/zookeeper-3.4.6
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin
```
  将配置好的环境变量分发给node03，node04
  
  [root@node02 zookeeper-3.4.6]# scp /etc/profile node03:/etc/
  
  [root@node02 zookeeper-3.4.6]# scp /etc/profile node04:/etc/
  
  读取profilesource /etc/profile
- zookeeper操作
  
  在全部会话中输入zkServer.sh start
  
  关闭zkServer.sh stop
  
  查看状态zkServer.sh status
启动journalnode节点,在node01，node02，node03分别启动

[root@node01 hadoop]# hadoop-daemon.sh start journalnode
格式化Namenode01

[root@node01 hadoop]# hdfs namenode -format
先启动NameNode01

[root@node01 hadoop]# hadoop-daemon.sh start namenode
在NameNode02中[root@node02 zookeeper-3.4.6]# hdfs namenode -bootstrapStandby将NameNode01中的数据拷贝到NameNode02中
查看zookeeper客户端

[root@node02 zookeeper-3.4.6]# zkCli.sh
在zookeeper中初始化高可用状态

[root@node01 hadoop]# hdfs zkfc -formatZK

启动节点

[root@node01 hadoop]# start-dfs.sh

成功则显示

Starting namenodes on [node01 node02]
node02: starting namenode, logging to /opt/sxt/hadoop-2.6.5/logs/hadoop-root-namenode-node02.out
node01: namenode running as process 1362. Stop it first.
node03: starting datanode, logging to /opt/sxt/hadoop-2.6.5/logs/hadoop-root-datanode-node03.out
node02: datanode running as process 1613. Stop it first.
node04: starting datanode, logging to /opt/sxt/hadoop-2.6.5/logs/hadoop-root-datanode-node04.out
Starting journal nodes [node01 node02 node03]
node01: journalnode running as process 1190. Stop it first.
node02: journalnode running as process 1351. Stop it first.
node03: journalnode running as process 1313. Stop it first.
Starting ZK Failover Controllers on NN hosts [node01 node02]
node01: starting zkfc, logging to /opt/sxt/hadoop-2.6.5/logs/hadoop-root-zkfc-node01.out
node02: starting zkfc, logging to /opt/sxt/hadoop-2.6.5/logs/hadoop-root-zkfc-node02.out

在这里插入图片描述