Hadoop 教程 3.x 版本的HA高可用配置和部署

用心去追梦

于 2024-06-25 11:09:43 发布

阅读量364

点赞数 3

文章标签： hadoop 大数据分布式

本文链接：https://blog.csdn.net/qq_33240556/article/details/139953831

版权

在Hadoop 3.x版本中配置高可用（HA）主要涉及NameNode的高可用性设置，以消除单点故障问题。以下是配置Hadoop 3.x高可用集群的基本步骤：

1. 环境准备

安装JDK: 确保所有节点都已安装并配置好Java Development Kit (JDK)。
配置SSH无密码登录: 在所有节点之间设置SSH无密码登录，包括NameNodes和DataNodes。

2. 安装和配置ZooKeeper

安装ZooKeeper: ZooKeeper作为分布式协作服务，用于管理Hadoop的HA状态。在独立的节点或NameNode节点上安装并配置ZooKeeper集群，确保其高可用。

3. 分发Hadoop

将Hadoop 3.x的安装包分发到所有节点，并解压到相同路径。

4. 配置Hadoop环境变量

在所有节点上设置Hadoop的环境变量，包括HADOOP_HOME和PATH。

5. 修改配置文件

core-site.xml: 添加或修改如下配置，指定ZooKeeper的地址和HDFS的名称服务。

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://nameservice1</value>
</property>
<property>
  <name>ha.zookeeper.quorum</name>
  <value>zk_node1:2181,zk_node2:2181,zk_node3:2181</value>
</property>

hdfs-site.xml: 配置NameNode HA和JournalNodes。

<property>
  <name>dfs.nameservices</name>
  <value>nameservice1</value>
</property>
<property>
  <name>dfs.ha.namenodes.nameservice1</name>
  <value>nn1,nn2</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.nameservice1.nn1</name>
  <value>nn1_host:8020</value>
</property>
<property>
  <name>dfs.namenode.http-address.nameservice1.nn1</name>
  <value>nn1_host:50070</value>
</property>
<!-- 类似地配置nn2 -->
<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://jn1_host:8485;jn2_host:8485;jn3_host:8485/nameservice1</value>
</property>