Hadoop HA （高可用）集群搭建

最新推荐文章于 2024-05-12 06:57:31 发布

匿名啊啊啊

最新推荐文章于 2024-05-12 06:57:31 发布

阅读量6.5k

点赞数 11

分类专栏： Hadoop HA 文章标签：集群搭建 Hadoop HA 高可用

本文链接：https://blog.csdn.net/qq_41851454/article/details/79666066

版权

Hadoop HA （高可用）集群搭建1、Hadoop HA 原理概述为什么会有 hadoop HA 机制呢？ HA：High Available，高可用在 Hadoop 2.0之前,在HDFS 集群中NameNode 存在单点故障 (SPOF：A Single Point of Failure)。对于只有一个 NameNode 的集群，如果 NameNode 机器出现故障(比如宕机或是软件、...

摘要由CSDN通过智能技术生成

Hadoop HA （高可用）集群搭建

1、Hadoop HA 原理概述

为什么会有 hadoop HA 机制呢？

HA：High Available，高可用

在 Hadoop 2.0之前,在HDFS 集群中NameNode 存在单点故障 (SPOF：A Single Point of Failure)。对于只有一个 NameNode 的集群，如果 NameNode 机器出现故障(比如宕机或是软件、硬件升级)，那么整个集群将无法使用，直到 NameNode 重新启动。

那如何解决呢？

HDFS 的 HA 功能通过配置 Active/Standby 两个 NameNodes 实现在集群中对 NameNode 的热备来解决上述问题。如果出现故障，如机器崩溃或机器需要升级维护，这时可通过此种方

式将 NameNode 很快的切换到另外一台机器。

在一个典型的 HDFS(HA) 集群中，使用两台单独的机器配置为 NameNodes 。在任何时间点，确保 NameNodes 中只有一个处于 Active 状态，其他的处在 Standby 状态。其中ActiveNameNode 负责集群中的所有客户端操作，StandbyNameNode 仅仅充当备机，保证一旦 ActiveNameNode 出现问题能够快速切换。

为了能够实时同步 Active 和 Standby 两个 NameNode 的元数据信息（实际上 editlog），需提供一个共享存储系统，可以是 NFS、QJM（Quorum Journal Manager）或者 Zookeeper，Active Namenode 将数据写入共享存储系统，而 Standby 监听该系统，一旦发现有新数据写入，则读取这些数据，并加载到自己内存中，以保证自己内存状态与 Active NameNode 保持基本一致，如此这般，在紧急情况下 standby 便可快速切为 active namenode。为了实现快速切换， Standby 节点获取集群的最新文件块信息也是很有必要的。为了实现这一目标，DataNode 需要配置 NameNodes 的位置，并同时给他们发送文件块信息以及心跳检测。

2、集群规划

描述：hadoop HA 集群的搭建依赖于 zookeeper，所以选取三台当做 zookeeper 集群我总共准备了四台主机，分别是 potter2，potter3，potter4，potter5。其中 potter2 和 potter3 做 namenode 的主备切换， potter4 和potter5 做resourcemanager 的主备切换。

四台：

	potter2	potter3	potter4	potter5
namenode	✔	✔
datanode	✔	✔	✔	✔
resourcemanager			✔	✔
nodemanager	✔	✔	✔	✔
zookeeper	✔	✔	✔
journalnode	✔	✔	✔
zkfc	✔	✔

五台：

	potter1	potter2	potter3	potter4	potter5
namenode	✔	✔
datanode	✔	✔	✔	✔	✔
resourcemanager			✔	✔
nodemanager	✔	✔	✔	✔	✔
zookeeper	✔	✔	✔	✔	✔
journalnode

最低0.47元/天解锁文章

匿名啊啊啊

关注

11
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
Hadoop HA （高可用）集群搭建

Hadoop HA （高可用）集群搭建1、Hadoop HA 原理概述为什么会有 hadoop HA 机制呢？ HA：High Available，高可用在 Hadoop 2.0之前,在HDFS 集群中NameNode 存在单点故障 (SPOF：A Single Point of Failure)。对于只有一个 NameNode 的集群，如果 NameNode 机器出现故障(比如宕机或是软件、...
复制链接

扫一扫

专栏目录