hadoop配置HA简单总结

最新推荐文章于 2024-08-26 16:26:51 发布

枫叶点旋律

最新推荐文章于 2024-08-26 16:26:51 发布

阅读量678

点赞数

分类专栏： hadoop 运维 HA

本文链接：https://blog.csdn.net/jason763/article/details/77826982

版权

hadoop 同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

运维

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

准备工作

在开始搭建集群环境之前，首先先简单介绍下我这边的本机环境：

1 hadoop版本2.5.1

2 采用v-box虚拟机搭建linux系统

3 linux系统节点分为是 master、slaver1、slaver2、slaver3、slaver4

4 需要准备zookeeper，这里zookeeper版本是3.4.6

HA各节点分布机器:

搭建zookeeper

在这里首先讲一下，搭建hadoop HA工作环境需要zookeeper进行服务协调，通过failovercontroller来动态判断哪个nannode是active的，哪一个namenode节点是standny状态的。所以鉴于此博主在这里先介绍搭建zookeeper工作步骤。

1 安装zookeeper

将zookeeper安装在master、slaver1、slaver2主机上，上传工具想必大家都知道我这里用的是Sftp工具上传的，然后依次用scp命令拷贝到slaver1、salver2主机上即可。

2 配置zookeeper集群

(1) 进入zookeeper安装目录中conf文件夹 cd /usr/zookeeper/zookeeper3.4.6/conf

(2) 将文件名为zoo_sample.cfg更改为zoo.cfg rm zoo_sample.cfg zoo.cfg

(3) 修改配置zoo.cfg文件加入以下参数:

dataDir=/root/zookeeper #dataDir参数是zookeeper数据存放目录

zookeeper官方集群文档配置地址是:https://zookeeper.apache.org/doc/r3.4.10/zookeeperStarted.html

#如下配置是zookeeper集群相关配置博主是参考zookeeper官方文档进行配置的

server.1=master:2888:3888
server.2=slaver1:2888:3888
server.3=slaver2:2888:3888

(4) 去配置dataDir目录创建工作文件夹我的是root/zookeeper/ 我就在root下新建zookeeper即可

(5) 在zookeeper数据存放目录(DataDir)文件内新建myid文件，文件内容根据集群参数确定 slaver中myid文件中为1、slaver2中myid文件值为2、slaver3中myid文件值为3

(6)slaver1节点上zookeeper算是配置完毕了将zookeeper整个文件夹拷贝到slaver2、slaver3主机上

scp -r /usr/zookeeper/zookeeper3.4.6 root@slaver2:/usr/zookeeper/zookeeper3.4.6

拷贝完毕后分别修改数据存放目录中myid文件值即可。

（7）关闭slaver1、slaver2、slaver3防火墙，分别slaver1、slaver2、slaver3进入zookeeper安装目录bin文件启动zookeeper服务启动命令是 ./zkServer.sh start 如果启动没有报错那我们就进入下一步，正式配置hadoop HA。

配置HA

1 安装hadoop

(1) 通过SFTP工具将hadoop2.5.1安装包上传到master主机上，我这边是放在/usr/hadoop/文件夹中的。

(2) 解压hadoop2.5.1压缩文件 tar -zxvf hadoop2.5.1.tar.gz

(3)进入hadoop安装目录中的/etc/hadoop目录下配置各个节点相关配置(配置HA最为核心的步骤):

1) 首先我们需要参照官方文档配置，博主这边就是参照官方进行配置的

官方参考帮助文档地址是:http://hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

2) 接下来按照官方进行配置为了方便我把我这边配置了的配置文件文件贴上来方便大家进行参考

hdfs-site.xml:

<configuration>
<!--定义整个HA集群服务名-->
<property>
  <name>dfs.nameservices</name>
  <value>liaozx</value>
</property>
<!--定义整个HA集群中namenode的id名  我这边按照官方命名 nn1、nn2...-->
<property>
  <name>dfs.ha.namenodes.liaozx</name>
  <value>nn1,nn2</value>
</property>
<!--定义第一个namnode nn1的RPC访问主机及端口-->
<property>
  <name>dfs.namenode.rpc-address.liaozx.nn1</name>
  <value>master:8020</value>
</property>
<!--定义第二个namnode nn2的RPC访问主机及端口-->
<property>
  <name>dfs.namenode.rpc-address.liaozx.nn2</name>
  <value>slaver1:8020</value>
</property>
<!--定义第一个namnode nn1的http访问主机及端口-->
<property>
  <name>dfs.namenode.http-address.liaozx.nn1</name>
  <value>master:50070</value>
</property>
<!--定义第二个namnode nn2的http访问主机及端口-->
<property>
  <name>dfs.namenode.http-address.liaozx.nn2</name>
  <value>slaver1:50070</value>
</property>
<!--定义三个journal nodel所在的主机位置-->
<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://slaver1:8485;slaver2:8485;slaver3:8485/liaozx</value>
</property>
<!--定义failovercontroller的provider-->
<property>
  <name>dfs.client.failover.proxy.provider.liaozx</name>
  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!--设置远程登录通信协议 这里是ssh协议-->
<property>
  <name>dfs.ha.fencing.methods</name>
  <value>sshfence</value>
</property>
<!--ssh协议中密匙存放目录文件-->
<property>
  <name>dfs.ha.fencing.ssh.private-key-files</name>
  <value>/root/.ssh/id_dsa</value>
</property>
<!--journal node工作目录-->
<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/home/jn/data</value>
</property>
<!--设置failovercontroller是否自定切换 在这里我设置的是自动切换-->
<property>
   <name>dfs.ha.automatic-failover.enabled</name>
   <value>true</value>
 </property>
</configuration>

注意:dfs.nameservice为整个集群服务名，我这里是我自己定义的。大家完全可以按照自己想法更改服务名

core-site.xml:

<configuration>
<!--指定默认hdfs集群服务名是哪个 -->
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://liaozx</value>
</property>
<!--指定zookeeper服务所在主机  我这里zookeeper服务所在节点在master、slaver1、slaver2主机上-->
<property>
   <name>ha.zookeeper.quorum</name>
   <value>master:2181,slaver1:2181,slaver2:2181</value>
 </property>
 <!--指定hadoop的hdfs工作目录配置  -->
<property>
  <name>hadoop.tmp.dir</name>
  <value>/root/hadoop2.5.1</value>
</property>
</configuration>

hadoop-env.sh:

在这个文件下只需要将export JAVA_HOME路径改了就OK,改成自己主机上jdk安装目录即可。

slaves:

需要说明一下，这个文件是配置datanode的配置文件，在集群中我们有3台datanode 那么就可以按照如下内容配置:

slaver2

slaver3

slaver4

mapred-site.xml:

<configuration>
<!--指定mapreduce计算框架是yarn-->
<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

yarn-site.xml:

<configuration>
	<!-- 指定ResourceManager节点的主机位置-->
     <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
	<!--剩下两个是按照官网指定配置的  指定mapreduce框架节点配置-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

   <property>
  <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
  <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>

OK,到这里我们就把整个HA集群需要的配置都配置好了，在配置好了过后我们把/etc/hadoop配置目录下所有文件拷贝并替换到其余主机上去，实现整个集群配置文件的统一性。

HA文件配置完了，我把我/etc/hosts文件共享出来，方便大家配置集群解决问题。

192.168.0.130  master
192.168.0.131 slaver1
192.168.0.132 slaver2
192.168.0.133 slaver3
192.168.0.134 slaver4

最后一点需要注意:集群中每台主机HA配置文件内容和hosts文件内容必须一致，另外zookeeper节点和zkfc节点上的zookeeepr/conf/zoo.cfg必须一致。

启动集群

配置好了过后不是不再是像hadoop1.x那样随便格式化就能启动的，在这个我把启动步骤列举出来，方便参阅。

1 将前面配置好的每台主机上的zookeeper服务启动起来敲jps命令有QuorumPeerMain这个进程就代表zookeeper成功启动

2 进入其中一个namenode节点主机，我这边namendnode主机是在master、slaver1主机上，我是在master主机上执行的操作。

3 记住，首先要启动journode节点格式化才能成功，在hadoop的sbin目录敲./hadoop-daemon.sh start journalnode命令启动journalnode，依次敲命令启动slaver1 、slaver2、slaver3节点journalnode服务。

4 对master主机上hdfs进行格式化

cd /usr/hadoop2.5.1/bin

./hdfs namenode -format

如果出现了success formated则证明格式化成功

5启动单个namenode节点，注意，这个数时候启动的是格式化hdfs主机节点上的namenode

进入sbin目录下

./hadoop-daemon start namenode 启动master上的namenode服务

6 将master上namenode上的工作文件夹目录拷贝到slaver1上通过一个命令就可以拷贝过去(执行命令前提是master主机上的hdfs启动成功) 在slaver1主机上执行以下命令:

cd /usr/hadoop/hadoop2.5.1/bin

./hdfs namenode -bootstrapstandby

7 initaling HA state zookeeper 初始化HA集群中zookeeper的状态在master主机上执行以下命令

cd /usr/hadoop/hadoop2.5.1/bin

./hdfs zkfc -formatZK

通过这个命令执行后我们的ZKFC就能成功启动。执行jps命令如果有有DFSZKFailoverController进程出现则代表zkfc服务启动成功。

8 停止master节点上停止单个namendoe服务

cd /usr/hadoop/hadoop2.5.1/bin

./hadoop-daemon stop namenode

9现在就可以启动整个集群中的hdfs服务了，进入master主机上执行以下命令启动集群中hdfs服务

cd /usr/hadoop/hadoop2.5.1/bin

./start-dfs.sh

如果执行上述命令没有报错，我们分别去master、slaver1、slaver2、slaver3、slaver4主机上执行jps命令查看是否有相应服务，对照着表格来核对服务是否完全启动，对照没有错误证明服务启动成功。在浏览器输入http://master:50070出现以下界面:

进入浏览器输入http://slaver1:50070出现以下界面:

对比一下两个界面可以知道master节点上namanode是active的，而slaver1主机上namnoed是standby状态的。

向HA中上传一个文件测试一下hdfs集群是否可用在master主机上运行以下命令:

cd /usr/hadoop/hadoop2.5.1/bin

./hdfs -mkdir -p /usr/file 新建/usr/file文件夹

./hdfs -put /root/test /usr/file 上传root下test文件到hdfs文件中/usr/file文件夹中

进入浏览器http://master:50070 进入页面点击utilities>>Browse the file system

出现如上界面代表我们的文件已经成功上传到hdfs中了。

到这一步HA就已经搭建成功了，我这边是按照hadoop官方文档进行搭建的，如果大家发现有什么错误欢迎指正。

参考资料:

http://hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

https://zookeeper.apache.org/doc/r3.4.10/zookeeperStarted.html

枫叶点旋律

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录