ha高可用集群一站式搭建

最新推荐文章于 2023-10-07 20:55:29 发布

置顶 C_time

最新推荐文章于 2023-10-07 20:55:29 发布

阅读量346

点赞数 1

分类专栏： Hadoop HDFS 文章标签： hadoop的高可用ha集群搭建

本文链接：https://blog.csdn.net/C_time/article/details/100134215

版权

HDFS 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

Hadoop

5 篇文章 0 订阅

订阅专栏

VMware11 已经装好
CenOS6.5镜像
hadoop-2.7.1安装包
Linux的JDK1.8安装包

1.安装VMrare11 自行安装

2.安装的是CenOS6.5 镜像

具体步骤看这个文章
Linux下mysql的安装 CentOS6.5
就是安装一台 Linux的虚拟机使用的镜像是CentOS6.5
’
安装完成了
Linux默认用户是root
密码是刚刚自己设置的我的是123456
’

3.修改主机名和映射

主机名貌似不是必须修改的
但映射必须改好后续再去克隆完其他两台虚拟机后也要修改这三台要都修改好

还有修改映射主机名两个文件

修改映射
vi  /etc/hosts
192.168.100.21 hadoop01 www.hadoop01.com
修改主机名
hostname hadoop01 
vi /etc/sysconfig/network
HOSTNAME=hadoop01 #修改localhost.localdomain为hadoop01

4.然后就是联网设置

LInux的CentOS6.5上网设置之NAT模式

5.安装JDK1.8

能联网了，下面一步就是安装JDK
简单上传解压配置环境变量
不过

注意要先卸载自带的OpenJDK

填坑

1.输入下面找到两个自带的openjdk
rpm -qa | grep jdk
2.删除这两个jdk
rpm -e --nodeps java-1.7.0-openjdk-1.7.0.45-2.4.3.3.el6.x86_64
rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64
3.将上传的jdk1.8解压到自己的安装目录
tar -zxvf /home/jdk-8u181-linux-x64.tar.gz -C  /usr/local/
4.解压完成配置环境变量
vi /etc/profile    JAVA_HOME=/usr/local/jdk1.8.0_181/    PATH=$PATH:$JAVA_HOME/bin:
5.更新一下配置文件
source /etc/profile
6.测试一下环境变量配置是否成功 出来版本号即可
java -version

6.克隆虚拟机

刚刚配置的hadoop01 现在配置hadoop02 和hadoop03

克隆虚拟机具体步骤！
https://blog.csdn.net/C_time/article/details/90383345

1.关机状态下右击虚拟机
2.管理—> 克隆
3. 完整克隆
4.起名字 hadoop02 下一台名字是hadoop03
5. 选位置一般三台放在一个文件夹即可最好不要放在C盘
6. 然后就可以了

等待克隆完成后需要修改好多东西
1.启动新创建的hadoop02
需要做一些配置
能让Windows连接上我们的服务器

克隆完的虚拟机大概要改4个地方

1.修改网卡信息
修改文件…vi /etc/udev/rules.d/70…net…eth0 后边这个名字忘了 tab一下试试能不能出来
有两个网卡 eth0是hadoop01的 eth1是克隆的删掉eth0 将eth1的1改为0
一定要改
不要使用原先的eth0 那个ATTR硬件地址是不一样的
2. 修改主机名和映射
临时修改一下
再修改文件
作永久性修改

还有修改映射 主机名 两个文件
vi  /etc/hosts
192.168.37.111  hadoop01 www.hadoop01.com
192.168.37.112  hadoop02 www.hadoop02.com

hostname hadoop02
vi /etc/sysconfig/network
HOSTNAME=hadoop02#修改localhost.localdomain为hadoop02

3.修改ip信息
vi /etc/sysconfig/network-scripts/ifcfg-eth0
1.进去之后改UUID 改成十六进制的随便改一个就行要跟原来的不一样我这里改了倒数第二个 a改成b
2.IPADDR换了上一个是111 这次我们112
3.HWADDR网卡信息要改照着右击虚拟机设置网络适配器高级改

5.善后重启服务
service network restart
ifconfig看一下
最好重启机器

6.成功的标志是用Windows的cmd命令能ping通

7.SSH免登陆配置

https://blog.csdn.net/C_time/article/details/90383366 具体步骤内容太多杂 ssh在文章中间往下的地方
简单步骤：
ssh-keygen -t rsa

一直回车直到生成图案

然后输入
ssh-copy-id hadoop01
输入yes然后输入密码
ssh-copy-id hadoop02
输入yes然后输入密码
ssh-copy-id hadoop03
输入yes然后输入密码

三台机子分别同样操作
实际两台就可以搭高可用三台机子时两个老大就行
就是说两个老大可以任意登录01 02 03三台机子不用输入密码

三台机器的映射 etc下的hosts文件都是这样的三句话将node改为hadoop 我的是这样哈
在这里插入图片描述

8.时间同步设置

这个没写完 … 我没配置直接进行后面了暂时是没事的因为后面azkaban这个调度工具需要时间同步后面弄也行
最好现在搞大家可以百度下

集群时间同步

时间同步的方式:找一个机器，作为时间服务器，所有的机器与这台集群时间进行定时
的同步，比如，每隔十分钟，同步一次时间

配置时间同步的步骤如下：

1）在root用户下检查是否安装ntp服务

[hadoop@hadoop01 hadoop-2.7.2]$ rpm -qa |grep ntp
fontpackages-filesystem-1.41-1.1.el6.noarch
ntpdate-4.2.6p5-10.el6.centos.x86_64
ntp-4.2.6p5-10.el6.centos.x8664

等等等

这里直接安装全分布式的高可用模式

就是说不再按照安装过程 1.单机版 2.伪分布式 3.全分布式 4.高可用
想依照这个过程安装的请看我前边的博客虽然乱但是全不过没有资源需要自行下载
Hadoop集群配置 Hadoop集群的启动和测试 SSH免登陆配置
 010 Zookeeper的基本概念 Zookeeper的集群搭建 Zookeeper的shell命令
 012 Yarn的ha配置和测试

8.Zookeeper安装

安装完jdk
克隆完
就安装Zookeeper

https://blog.csdn.net/C_time/article/details/90487667 具体步骤

1 现将Zookeeper安装包通过Xshell工具上传到home目录下
2.解压安装

tar -zxvf ./zookeeper-3.4.7.tar.gz -C /usr/local/

3.解压后我们开始配置
配置环境变量

vi /etc/profile

然后

source /etc/profile

一下

进入到Zookeeper目录

然后我们需要配下面划线的东西是zk的一个模板文件
不过需要先改个名

mv ./conf/zoo_sample.cfg ./conf/zoo.cfg

然后进入修改该文件
将注释按两下d删一行·都删掉
然后照着截图改一下数字 5 2
然后再加上最后三句
在这里插入图片描述

4.这台机子配完了然后copy到02 03上去

scp -r …/zookeeper-3.4.7/ hadoop02:/usr/local/
scp -r …/zookeeper-3.4.7/ hadoop03:/usr/local/

这样然后都改一下02 03的环境变量

4.最后别忘了创建文件夹
我们在上面这一步修改的这个dataDir这个目录
没有相应文件夹所以需要我们一个一个创建
三个机子01 02 03都要创建

5.然后我们需要在每个机子下面的这个zkdata目录创建一个myid的文件

在安装过程中zk启动不起来就是因为没有创建myid文件
内容上面文件最后三句话的Server编号
server.1
server.2
server.3

后面这个数字 01就写1
02 就写2
03就写3
例如hadoop03的myid
在这里插入图片描述
6.现在我们可以使用zkServer.sh start命令启动了

注意需要前面改过名字zoo.cfg这个名字不然没法使用没改的话需要在命令后面加上路径 ./conf/zoo/cfg

系统默认识别这个zoo.cfg

hadoop的ha安装配置

https://blog.csdn.net/C_time/article/details/90488535

具体步骤地址

namenode弄两个
jouranlnode奇数个

现在开始弄了

第一步如果你开了集群先停止掉 stop-all.sh
然后要备份一下万一以后有什么需要用到普通集群了所以需要备份

mv /usr/local/hadoop-2.7.1/ /usr/local/hadoop-2.7.1_bak

（这里使用了mv 直接移动了改了名字做成了备份然后吧
重新解压hadoop安装包重新安装了
）记住是三个机子的hadoop都要移动备份

第二步然后重新解压在home下的hadoop安装包（在hadoop01下进行）

tar -zxvf /home/hadoop-2.7.1.tar.gz -C /usr/local/

总共配置4个文件

[①先修改hadoop-env.sh]

查找jdk目录修改
/# The java implementation to use.
export JAVA_HOME=/usr/local/jdk1.8.0_181/
在这里插入图片描述

②core-site.xml

<!--配置hdfs文件系统的命名空间-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://ali</value>
</property>
<!--配置操作hdfs的缓存大小-->
<property>
<name>io.file.buffer.size</name>
<value>4096</value>
</property>
<!--配置临时数据存储目录-->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hahadoopdata/tmp</value>
</property>
<!-- 指定zk的集群地址 用来协调namenode的服务 -->
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
</property>

以前配hdfs不是写的hadoop01吗这里写qf是因为到时候01 02 不一定用的哪一个所以写一个虚拟的ali名

③hdfs-site.xml

	<name>dfs.replication</name>
	<value>3</value>
	</property>
	<!--块大小_hadoop2_128M_hadoop1_64M_hadoop3.0_256M-->
	<property>
	<name>dfs.block.size</name>
	<value>134217728</value>
	</property>
	<!--hdfs的元数据存储位置-->
	<property>
	<name>dfs.namenode.name.dir</name>
	<value>/home/hahadoopdata/dfs/name</value>
	</property>
	<!--hdfs的数据存储位置-->
	<property>
	<name>dfs.datanode.data.dir</name>
	<value>/home/hahadoopdata/dfs/data</value>
	</property>


	<!--指定hdfs的虚拟服务名-->
	<property>
	  <name>dfs.nameservices</name>
	  <value>ali</value>
	</property>
	<!--指定hdfs的虚拟服务名下的namenode的名字-->
	<property>
	  <name>dfs.ha.namenodes.ali</name>
	  <value>nn1,nn2</value>
	</property>
	<!--指定namenode的rpc内部通信地址-->
	<property>
	  <name>dfs.namenode.rpc-address.ali.nn1</name>
	  <value>hadoop01:8020</value>
	</property>
	<property>
	  <name>dfs.namenode.rpc-address.ali.nn2</name>
	  <value>hadoop02:8020</value>
	</property>
	<!--指定namenode的web ui界面地址-->
	<property>
	  <name>dfs.namenode.http-address.ali.nn1</name>
	  <value>hadoop01:50070</value>
	</property>
	<property>
	  <name>dfs.namenode.http-address.ali.nn2</name>
	  <value>hadoop02:50070</value>
	</property>
	<!--指定jouranlnode数据共享目录 namenode存放元数据信息的Linux本地地址 这个目录不需要我们自己创建-->
	<property>
	  <name>dfs.namenode.shared.edits.dir</name>
	  <value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ali</value>
	</property>
	<!--指定jouranlnode本地数据共享目录-->
	<property>
	  <name>dfs.journalnode.edits.dir</name>
	  <value>/home/hahadoopdata/jouranl/data</value>
	</property>
	<!-- 开启namenode失败进行自动切换 -->
	 <property>
	   <name>dfs.ha.automatic-failover.enabled</name>
	   <value>true</value>
	 </property>
	<!--指定namenode失败进行自动切换的主类 datanode存放用户提交的大文件的本地Linux地址 这个目录不需要我们自己创建-->
	<property>
	  <name>dfs.client.failover.proxy.provider.ali</name>
	  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
	</property>

	<!--防止多个namenode同时active(脑裂)的方式 采用某种方式杀死其中一个-->
	<property>
	  <name>dfs.ha.fencing.methods</name>
	  <value>sshfence</value>
	</property>
	<property>
	  <name>dfs.ha.fencing.ssh.private-key-files</name>
	  <value>/root/.ssh/id_rsa</value>
	</property>
	<property>
	  <name>dfs.ha.fencing.ssh.connect-timeout</name>
	  <value>30000</value>
	</property>

④slaves

添加三个主机名哎哎哎好像是映射的那个名字

就是文件里面写
hadoop01
hadoop02
hadoop03
在这里插入图片描述

⑤ yarn-site.xml

<?xml version="1.0"?>

<configuration>
	<!--指定MapReduce的shuffle-->
	<property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
	</property>
	<!--是否启用yarn的HA-->
	<property>
	  <name>yarn.resourcemanager.ha.enabled</name>
	  <value>true</value>
	</property>
	<!--yarn的HA虚拟服务名-->
	<property>
	  <name>yarn.resourcemanager.cluster-id</name>
	  <value>aliyarn</value>
	</property>
	<!--yarn的HA虚拟服务名下的具体的rm-->
	<property>
	  <name>yarn.resourcemanager.ha.rm-ids</name>
	  <value>rm1,rm2</value>
	</property>
	<!--指定rm1的所启动的主机-->
	<property>
	  <name>yarn.resourcemanager.hostname.rm1</name>
	  <value>hadoop01</value>
	</property>
	<!--指定rm2的所启动的主机-->
	<property>
	  <name>yarn.resourcemanager.hostname.rm2</name>
	  <value>hadoop02</value>
	</property>
	<!--rm1的web ui的通信地址-->
	<property>
	  <name>yarn.resourcemanager.webapp.address.rm1</name>
	  <value>hadoop01:8088</value>
	</property>
	<!---->
	<property>
	  <name>yarn.resourcemanager.webapp.address.rm2</name>
	  <value>hadoop02:8088</value>
	</property>
	<!---->
	<property>
	  <name>yarn.resourcemanager.zk-address</name>
	  <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
	</property>
</configuration>

mapred-site.xml

<configuration>
	<!--指定MapReduce的运行框架-->
	<property>
	<name>mapreduce.framework.name</name>
	<value>yarn</value>
	<final>true</final>
	</property>
	<!--历史服务的通信地址-->
	<property>
	<name>mapreduce.jobhistory.address</name>
	<value>hadoop01:10020</value>
	</property>
	<!--历史服务的web ui地址-->
	<property>
	<name>mapreduce.jobhistory.webapp.address</name>
	<value>hadoop01:19888</value>
	</property>
</configuration>

这样ha就配置完成（hadoop01）的
然后我们检查一下再说配置文件很容易出问题不是名字写错就是少个点

感觉没啥问题保存退出wq

分发到02 03的机子上

scp -r ../hadoop-2.7.1 hadoop02:/usr/local/

scp -r ../hadoop-2.7.1 hadoop03:/usr/local/

Zookeeper问题要是启动不起来如果是下面的问题可以看这个
Zookeeper集群查看状态失败 Error contacting service. It is probably not running.
修改三台机子这个
这是在03机子上的配置
vi /usr/local/zookeeper-3.4.7/conf/zoo.cfg

tickTime=2000
initLimit=5
syncLimit=2
dataDir=/home/zkdata/
clientPort=2181
server.1=node01:2888:3888
server.2=node02:2888:3888
server.3=0.0.0.0:2888:3888

一定要创建zkdata的myid

注意：在进行下面的步骤之前要确定

1.Zookeeper安装了配置文件zoo.cfg弄了而且

而且目录zkdata下面应该被我们创建了myid

2.hadoop安装了那么多配置文件都配置好了
3.环境变量 zk的hadoop的bin的sbin的 java的都配置了

如果之前配置了没有ha的全分布式的东西且使用过肯定产生了一些文件把现在配置文件下面的路径的东西删除

https://blog.csdn.net/C_time/article/details/100123509 看这个不清楚的话步骤还按下面的来

现在我们按照顺序执行启动

对了环境变量搞完一定要source 一下更新一下配置文件
source /etc/profile
在这里插入图片描述
具体带截图步骤可以 https://blog.csdn.net/C_time/article/details/90488535 看这个在后半部分有点乱
本篇博客简略一些不带大量截图了

①先启动`zk zkServer.sh` 三台都要启动

然后jps命令查看服务是否启动 QuorumPeerMain
启动完Zookeeper 必须使用zkServer.sh status挨个查看服务看看有没有leader或者follower 没有就是有错误的可以看看
Zookeeper集群查看状态失败 Error contacting service. It is probably not running.

②启动journalnode服务

这个服务使用使用start-all.sh不能启动需要单独启动

`hadoop-daemons.sh start journalnode`

③挑选01 02 任意一台格式化然后启动namenode

这里我们选01

hdfs namenode -format

格式化后会创建配置文件配置的目录/home/hahadoopdata/dfs/name 而且下面是有东西的可以进去看看有没有
没有可能失败了配置文件问题一般是

④然后在01单独启动namenode

在01输入命令

hadoop-daemon.sh start namenode

⑤ 02在另外一台namenode的机子上拉取元数据（也可以使用复制那个name文件夹）

即在02上
注意在执行命令前 02下是没有刚刚01生成的那个目录的就是name目录（具体路径就是配置文件配置的那个）

hdfs namenode -bootstrapStandby

执行完成之后我们再看看有了这就代表拉取元数据成功

⑥ 01 格式化zkfc

我们在02下登录 zkCli.sh
然后ls / 结果发现还有别的（以前用过Zookeeper 新的只有一个节点）我们先删掉使用 rmr 命令只留下zookeeper这一个根节点就行
然后我们在01下格式化

hdfs zkfc -formatZK

执行后再在02那个界面已经登录zk的地方 ls / 发现多了一个ha-hadoop节点该节点下面还有ali这个节点

这样就可以了

在01或02执行start-all启动整个集群

start-all.sh

01 02 有namenode
01 02 03有datanode journalnode
在这里插入图片描述

启动MapReduce任务的历史记录这个需要单独启动

mr-jobhistory-daemon.sh start historyserver

这样就好了

测试

1.上传文件
第一个是本地文件路径自己找一个另外一个上传到hdfs根目录下

hdfs dfs -put /home/1.txt  /

2.查看命令可以看到刚刚上传的文件

hdfs dfs -ls /

3.192.168.37.111:50070 前边是01或者02的映射的ip地址后边是50070端口
可以登录web ui界面然后换成112 再看看一个是active 一个是standby的状态

这两个测试完没问题一般就没问题了

如果出了问题：别急

不外乎几个原因：
1.配置文件的问题
这个出了问题好难找但是还要找可能是名字写错或者路径写错
2.虚拟机防火墙要关闭
3.虚拟机映射三台机子都要弄好
4.出了错误一定要好好看是什么错误一定要学会看日志
日志文件在哪里看我们的配置文件没配置的就在默认的地方一般在安装目录logs下去找找看

其他

1.要在浏览器输入 hadoop01:50070这样的不输入ip地址就能访问需要配置Windows的hosts文件具体方法百度
然后在windows加hosts映射
2.以后写Java API需要在Windows配置hadoop的环境变量和安装hadoop的文件具体方法百度
我就提个醒哎都没人跟我说！气

文章肯定有不对的地方如果找到了请指出，谢谢

C_time

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ha高可用集群一站式搭建

VMware11 已经装好CenOS6.5镜像hadoop-2.7.1安装包Linux的JDK1.8安装包1.安装VMrare11 自行安装2.安装CenOS6.5Linux下mysql的安装 CentOS6.5就是安装一台 Linux的虚拟机使用的镜像是CentOS6.53.修改主机名和映射’安装完成了Linux默认用户是root密码是刚刚自己设置的我的是12345...
复制链接

扫一扫