配置Hadoop的HA(高可用)

最新推荐文章于 2023-03-16 23:47:54 发布

DimplesDimples.

最新推荐文章于 2023-03-16 23:47:54 发布

阅读量309

点赞数

分类专栏： Hadoop

本文链接：https://blog.csdn.net/Betty_betty_betty/article/details/84203324

版权

Hadoop 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

在搭建完全分布式的基础上配置HA。

一、手动HA。

1、首先将完全分布式的配置文件备份。复制一份配置文件用来搭建HA。

$ cp -r /home/betty/soft/hadoop/etc/cluster_hadoop /home/betty/soft/hadoop/etc/HA_hadoop

$ rm hadoop -------删掉之前的软连接。

$ ln -s HA_hadoop hadoop --------重新创建指向HA_hadoop的软连接。

2、修改配置文件

hdfs-site.xml

【

<property>
<!-- 此新名称服务的逻辑名称 -->
      <name>dfs.nameservices</name>
      <value>mycluster</value>
</property>

  <property>
<!--配置逗号分隔的NameNode ID列表-->
      <name>dfs.ha.namenodes.mycluster</name>
      <value>nn1,nn2</value>
  </property>

  <property>
      <name>dfs.namenode.rpc-address.mycluster.nn1</name>
      <value>dog1:9000</value>
  </property>

<property>
      <name>dfs.namenode.rpc-address.mycluster.nn2</name>
      <value>dog2:9000</value>
</property>

<property>
      <name>dfs.namenode.http-address.mycluster.nn1</name>
      <value>dog1:50070</value>
</property>

<property>
      <name>dfs.namenode.http-address.mycluster.nn2</name>
      <value>dog2:50070</value>
</property>

<property>
<!--这是一个配置JournalNodes地址的地方，它提供共享编辑存储-->
      <name>dfs.namenode.shared.edits.dir</name>
      <value>qjournal://dog1:8485;dog2:8485;dog3:8485/mycluster</value>
</property>

  <property>
<!--配置Java类的名称，DFS客户端将使用该名称来确定哪个NameNode是当前的Active，以及哪个NameNode当前正在为客户端请求提供服务。-->
      <name>dfs.client.failover.proxy.provider.mycluster</name>
      <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  </property>

 <property>
<!--SSH到Active NameNode并终止进程-->
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
 </property>

 <property>
<!--该选项是以逗号分隔的SSH私钥文件列表-->
      <name>dfs.ha.fencing.ssh.private-key-files</name>
      <value>/home/betty/.ssh/id_rsa</value>
 </property>

】

core-site.xml

<property>
      <name>fs.defaultFS</name>
      <value>hdfs://mycluster</value>
</property>

<property>
      <name>dfs.journalnode.edits.dir</name>
      <value>/home/hyxy/soft/tmp/journalnode</value>
</property>

3、（新集群请跳到下面第5步）如果你已经格式化了NameNode，或者正在将启用了HA的集群转换为启用HA，则应该通过运行命令“ hdfs namenode bootstrapStandby ”将NameNode元数据目录的内容复制到另一个未格式化的NameNode上。
hadoop-daemon.sh start namenode
hdfs namenode bootstrapStandby（执行此命令前，请确保namenode是在运行状态）

4、如果要将非HA NameNode转换为HA，则应运行命令“ hdfs namenode -initializeSharedEdits ”，该命令将使用来自本地NameNode编辑目录的编辑数据初始化JournalNodes。
hadoop-daemon.sh stop namenode
hdfs namenode -initializeSharedEdits（执行此命令前，请确保namenode停止运行）

5、如果是新集群，请忽略3、4步，从此篇博客的第11步中配置yarn-site.xml开始往下进行，步骤基本一致。只有第13步，在格式化之前，先在每个节点上启动journalnode。
hadoop-daemon.sh start journalnode

6、无论是新集群还是从非HA转HA，执行完上述步骤，手动HA就搭建完成了。然后我们需要测试。
把其中一个namenode切换成活跃的（先在web中查看两个namenode的状态）
hdfs haadmin -transitionToActive nn1
上传文件。
$hdfs dfs -put ~/soft/hadoop/etc/slaves /betty
查看文件是否上传成功。
$hdfs dfs -ls /betty

二、自动HA

1、先在所有节点上安装和配置ZooKeeper,参照博客配置到第15步。（注意：执行到14步时是在手动HA的配置中添加该配置。）

2、在每台机器上启动zookeeper
zkServer.sh start

3、在每台机器上启动journalnode
hadoop-daemon.sh start journalnode

4、在其中一台namenode上格式化(如果是新集群已经格式化了就不需要此步骤，如果是旧集群已经格式化则需要删除hadoop.tmp.dir路径下的文件夹再格式化）
hdfs namenode -format

5、格式化后会生成tmp文件夹，发送给另外一个namenode
scp -r ~/soft/tmp betty@slave1:~/soft/tmp

6、执行此博客的16步。

7、在未格式化的namenode上同步数据
hdfs namenode -bootstrapStandby

8、启动集群
start-dfs.sh
如果在配置之前就已经启动了集群，则使用以下命令单独开启zkfc守护进程
hadoop-daemon.sh start zkfc

9、测试，使用下面命令杀死状态为active的namenode进程，然后在web界面查看另一个namenode状态是否变为active。
kill -9 namenode的进程id

DimplesDimples.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
配置Hadoop的HA(高可用)

在搭建完全分布式的基础上配置HA。一、手动HA。1、首先将完全分布式的配置文件备份。复制一份配置文件用来搭建HA。$ cp -r /home/betty/soft/hadoop/etc/cluster_hadoop /home/betty/soft/hadoop/etc/HA_hadoop$ rm hadoop -------删掉之前的软连接。$ ln -s HA_hadoo...
复制链接

扫一扫