Hadoop 3.X HA集群部署

准备工作

1、确认各个服务器网络是否互通、时间是否同步

2、确认各个节点部署那些组件

ip地址host名部署组件
192.168.190.130h202406131

NameNode

ResourceManager

QuorumPeerMain

JournalNode

DFSZKFailoverController

JobHistoryServer

192.168.190.131h202406132

NameNode

ResourceManager

QuorumPeerMain

JournalNode

DFSZKFailoverController

JobHistoryServer

192.168.190.132h202406133

QuorumPeerMain

JournalNode

DataNode

NodeManager

192.168.190.133h202406134

DataNode

NodeManager

192.168.190.134h202406135

DataNode

NodeManager

192.168.190.135h202406136

DataNode

NodeManager

192.168.190.136h202406137

DataNode

NodeManager

192.168.190.137h202406138

DataNode

NodeManager

3、配置各个节点的  /etc/hosts

4、配置用户的免密登录

5、确认各个组件版本

Hadoop3.3.1
zookeeper3.7.0
jdk1.8

6、确认安装目录,并配置环境变量

安装jdk

# 安装java
yum install -y java-1.8.0-openjdk.x86_64


# 配置环境变量
vim /etc/profile

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.372.b07-1.el7_9.x86_64/jre
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

# 验证安装
java -version

安装zookeerper

下载路径:http://archive.apache.org/dist/zookeeper/

cd /data
tar -xf zookeeper-3.7.0.tar.gz
mv zookeeper-3.7.0 zookeeper

安装hadoop

下载命令:

 wget  https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1-aarch64.tar.gz 

启动步骤

1、各个zk节点启动zk

zk启动命令:./bin/zkServer.sh start

zk状态查询命令:./bin/zkServer.sh status

2、各个journalnode节点启动journalnode

启动命令:hadoop-daemon.sh start journalnode

3、在nn1节点上格式化、并启动namenode

初始化namenode:hdfs namenode -format

启动namenode:hadoop-deaemon.sh start namedoe

4、在nn2节点上格同步nn1的节点信息并启动namenode

同步nn1:hdfs namenode -bootstarpStandby

启动namenode:hadoop-deaemon.sh start namedoe

5、关闭nn1和nn2的namenode并初始化HA在zk中的状态

初始化zkfc:hdfs zkfc -formatZK

6、nn1启动历史服务器

JobHistoryServer启动:mr-jobhistory-daemon.sh start JobHistoryServer

7、nn1和nn2启动zkfc

启动zkfc:hadoop-deaemon.sh start zkfc

8、datanode节点启动datanode服务

datanode启动:hadoop-deaemon.sh start datanode

9、nn1和nn2节点启动 resourcemanager

resourcemanager启动:yarn-daemon.sh start resourcemanager

10、NodeManager节点启动NodeManager服务

NodeManager启动:yarn-daemon.sh start nodemanager

Hadoop High Availability (HA) 集群部署是指在一个集群中设置冗余,以确保即使在某个节点故障的情况下,数据处理和任务执行也能继续进行,提高系统的可靠性和可用性。下面是Hadoop HA集群部署的基本步骤: 1. **配置Hadoop集群**: 安装Hadoop配置多个名称节点(NameNode)和任务跟踪器(JobTracker)。在Hadoop 2.x及以上版本,NameNode被替换为两个实例:Active NameNode(处理写入请求)和Standby NameNode(备份数据)。 2. **启用HA**: 在Hadoop配置文件(如core-site.xml和hdfs-site.xml)中启用HA模式。设置`ha.zookeeper.quorum`用于ZooKeeper服务的连接,这是协调NameNode状态的关键组件。 3. **安装ZooKeeper**: ZooKeeper作为元数据存储和命名服务,管理NameNode的状态。每个NameNode会连接到ZooKeeper,以同步集群状态。 4. **配置HA组件**: 创建并配置Hadoop的资源管理器(ResourceManager)和DataNode,它们将与新的High Availability架构协同工作。 5. **配置Fencing**: Fencing机制确保在主节点故障时,不发生冲突的切换。这可能涉及到网络或硬件级别的措施。 6. **启动Standby NameNode**: 启动Standby NameNode并让其监听,等待接替Active NameNode的角色。 7. **监控与自动故障切换**: 使用Hadoop的管理工具如JMX或Web UI监控集群状态,并配置自动故障切换,当主节点失效时,Standby会自动接管。 8. **测试**: 最后,进行充分的负载测试和故障恢复演练,确保HA集群能够在实际环境中正常运行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值