hadoop之HDFS HA(高可用)架构安装部署

前言

再看本文章之前,请先确保已经看过CentOS下hadoop的分布式搭建分布式协作服务框架Zookeeper安装部署两篇文章,因为本文章是建立在它们基础之上的。

一、HA相关介绍

1、为什么出现HA架构

Hadoop2.0之前,在HDFS集群中NameNode存在单点故障(SPOF)(也就是namenode单点宕机导致集群不可用的问题)。

NameNode主要在以下两个方面影响HDFS集群:

  • NameNode机器发生意外,如宕机,集群将无法使用,直到管理员重启
  • NameNode机器需要升级,包括软件、硬件升级,此时集群也将无法使用

HDFS HA功能通过配置Active/Standby两个NameNode结点实现在集群中对NameNode元数据的备份来解决上述问题。如果出现故障或者机器需要升级维护,这时可以通过此种方式将NameNode切换到另一台机器。

2、HDFS HA设计
在这里插入图片描述
在这里插入图片描述

上面两个图展示了HA设计的逻辑图。通过上图可以看出我们的edits是存储在namenode结点中的。而编辑日志记录所有的信息,每次关闭集群edits都会和fsimage合并成新的fsimage,而重启集群的时候,系统会读取fsimage,并生成新的edits。因此HA架构的关键性是保证两个NameNode的edits一致,同时保证edits的安全性,这可以用journalnode实现。同时我们客户端访问HDFS的时候,不再是直接访问NameNode,因为客户端事先不知道哪个NameNode是Active状态,因此我们需要通过代理访问HDFS。除此之外,现在集群中出现了两个NameNode,集群启动的时候可能会出现冲突情况(即两个NameNode都是Active状态),为此我们还需要隔离两个NameNode,确保同一时刻只能有一个NameNode是活跃状态。
综上所述,HA的配置要点如下:

  • 共享edits
  • 配置两个NameNode
  • 客户端通过Proxy访问
  • 隔离两个NameNode
二、HA配置

1、规划集群

Hadoop1 Hadoop2 Hadoop3
NameNode NameNode
Journ
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值