(Hdoop)HDFS—HA高可用详解

最新推荐文章于 2024-08-26 16:26:51 发布

AngeJT

最新推荐文章于 2024-08-26 16:26:51 发布

阅读量8.8k

点赞数 11

分类专栏： Hadoop 文章标签： HDFS HA 高可用

本文链接：https://blog.csdn.net/weixin_37838429/article/details/81710045

版权

本文详细介绍了HDFS的高可用性(HA)功能，通过配置Active/Standby NameNode实现热备。文章涵盖了手动和自动故障转移的步骤，包括元数据管理、Zookeeper集群的配置以及YARN-HA的设置，旨在确保集群在NameNode故障时能快速切换并保持服务连续性。

摘要由CSDN通过智能技术生成

一、HA概述

1）所谓HA（high available），即高可用（7*24小时不中断服务）。
2）实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA
   机制：HDFS的HA和YARN的HA。
3）Hadoop2.0之前，在HDFS集群中NameNode存在单点故障（SPOF）。
4）NameNode主要在以下两个方面影响HDFS集群
NameNode机器发生意外，如宕机，集群将无法使用，直到管理员重启
NameNode机器需要升级，包括软件、硬件升级，此时集群也将无法使用

HDFS HA功能通过配置Active/Standby两个nameNodes实现在集群中对NameNode的热备来解决上述问题。如果出现故障，如机器崩溃或机器需要升级维护，这时可通过此种方式将NameNode很快的切换到另外一台机器。

二、工作机制

配置两个namenode，通过双namenode消除单点故障。

三、HDFS-HA手动故障转移

1.工作要点

1）元数据管理方式需要改变：

内存中各自保存一份元数据；
Edits日志只有Active状态的namenode节点可以做写操作；
两个namenode都可以读取edits；
共享的edits放在一个共享存储中管理（qjournal和NFS两个主流实现）；

2）需要一个状态管理功能模块

实现了一个zkfailover，常驻在每一个namenode所在的节点，每一个zkfailover负责监控自己所在namenode节点，利用zk进行状态标识，当需要进行状态切换时，由zkfailover来负责切换，切换时需要防止brain split现象的发生。

3）必须保证两个NameNode之间能够ssh无密码登录。
4）隔离（Fence），即同一时刻仅仅有一个NameNode对外提供服务

2.环境准备

1）修改IP
2）修改主机名及主机名和IP地址的映射
3）关闭防火墙
4）ssh免密登录
5）安装JDK，配置环境变量等

3.规划集群

hadoop102	hadoop103	hadoop104
NameNode	`NameNode`
`JournalNode`	`JournalNode`	`JournalNode`
DataNode	DataNode	DataNode
	ResourceManager
NodeManager	NodeManager	NodeManager

4.配置HDFS-HA集群(以三台为例)

1）官方地址：http://hadoop.apache.org/
2）在/opt/module/目录下创建一个HA文件夹

mkdir HA

3）将/opt/module/下的 hadoop-2.7.2拷贝到/opt/module/HA目录下

[admin@hadoop102 module]$ cp -r hadoop-2.7.2/ /opt/module/HA/

4）配置hadoop-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144

5）配置core-site.xml

<configuration>
<!-- 把两个NameNode）的地址组装成一个集群mycluster -->
    <property>
        <name>fs.defaultFS</name>
            <value>hdfs://mycluster</value>
    </property>

    <!-- 声明journalnode服务本地文件系统存储目录-->
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/opt/module/HA/hadoop-2.7.2/data/jn</value>
    </property>

    <!-- 指定hadoop运行时产生文件的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/HA/hadoop-2.7.2/data/tmp</value>
    </property>
</configuration>

6）配置hdfs-site.xml

<configuration>
    <!-- 完全分布式集群名称 -->
    <property>
        <name>dfs.nameservices</name>
        <value>mycluster</value>
    </property>

    <!-- 集群中NameNode节点都有哪些 -->
    <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2</value>
    </property>

    <!-- nn1的RPC通信地址 -->
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>hadoop102:8020</value>
    </property>

    <!-- nn2的RPC通信地址 -->
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2</name>
        <value>hadoop103:8020</