Hadoop高可用HDFS集群搭建详解

最新推荐文章于 2024-05-03 15:27:48 发布

Mithrandir_One

最新推荐文章于 2024-05-03 15:27:48 发布

阅读量1.1k

点赞数

分类专栏：大数据+云计算文章标签： hadoop hdfs 集群集群高可用搭建详解

本文链接：https://blog.csdn.net/Mithrandir_One/article/details/53781406

版权

大数据+云计算专栏收录该内容

2 篇文章 0 订阅

订阅专栏

说明：

Hadoop高可用ＨＤＦＳ集群搭建步骤详解，在搭建的过程中会出现各种各样的问题，大家要养成看日志的习惯，大部分错误在启动或者搭建的过程中都会在日志中体现，（由于日志信息过多，一般错误会在日志最后部分出现建议使用ｔａｉｌ命令查看日志，注意不要粘贴命令，格式问题）

集群图表：

这里写图片描述

步骤１：准备工作

保证网络可以ｐｉｎｇ通
hosts文件要修改（也可不修）
防火墙关闭
-

关闭防火墙方法：
1) 重启后生效
开启： chkconfig iptables on
关闭： chkconfig iptables off
2) 即时生效，重启后失效
开启： service iptables start
关闭： service iptables stop

步骤２：同步时间（可选择，建议同步）

确保安装了ntpdate，
没安装的话使用命令进行安装：yum install ntpdate
然后执行命令：ntpdate 132.163.4.101

步骤３：进行免密钥设置

每一台NN 需要免密钥登录到集群当中其他的机器
两台NN之间一定要做免密钥：
node1到node1~4　做免密钥
node2到node1~4　做免密钥

①在node1节点生成密钥
ssh-keygen -t dsa -P ” -f ~/.ssh/id_dsa
②cd到密钥所在的文件夹目录下:cd ~/.ssh/id_dsa，将生成的密钥拷贝到所有需要免密钥登陆的节点上，如：
scp id_dsa.pub node2:/tmp
scp id_dsa.pub node3:/tmp
scp id_dsa.pub node4:/tmp
③在所有需要免密钥的节点上(node~node3)，将NameNode的公钥添加到 ~/.ssh/uthorized_keys文件的最后，如：
cat /id_dsa.pub >> ~/.ssh/authorized_keys
④在node1测试免密钥登陆node3
验证下：
ssh node2——>登陆node2
exit 退出

步骤４：安装jdk 配置环境变量

可以使用xftp工具，将JDK拷贝到指定目录：如：/home/tools目录（tools没的话可以创建）

解压（默认在当前目录）：tar -zxvf hadoop-2.5.1_x64.tar.gz
（为了节省时间提高效率）在node1节点上，使用 scp jdk-7u67-linux-x64.rpm node2:｀pwd｀ 命令将jdk分别复制到node2~4的 /home/tools目录
(pwd就相当于 /home/tools目录,也可以写全，使用反引号括起来)

配置jdk：使用命令：vi /etc/profile，建议在最后添加：

export JAVA_HOME=/usr/java/jdk1.7.0_67
export PATH=$PATH:$JAVA_HOME/bin

使用命令：source /etc/profile，使之生效

步骤５：Hadoop安装包上传(不要放到tmp)并解压、配置环境变量（zookeeper包同样的方式上传、解压、配置环境变量！！！）

解压：tar -zxvf hadoop-2.5.1_x64.tar.gz -C /home/
配置环境变量：ｖｉｍ　／ｅｔｃ／ｐｒｏｆｉｌｒ
export HADOOP_HOME=ｈａｄｏｏｐ安装路径 export　PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

步骤６：修改配置文件（最需要细心的一步）

这里写图片描述

Hadoop需要配置的文件：
core-site.xml
hdfs-site.xml
slaves 指定DN
yarn-site.xml
mapred-site.xml
hadoop-env.sh

zookeeper需要配置的文件：

zoo.cfg（这个是经过修改文件名称过来的）
并创建：vim myid，分别在每个虚拟机里写上1、2、3、4

步骤７：同步配置文件

拷贝一个目录到另外虚拟机：

Hadoop需要拷贝到node2~4台上
scp -r hadoop-2.5.1 node4:pwd
zookeeper需要拷贝到前三台上：
scp -r zookeeper-3.4.6 node4:｀pwd｀

步骤８：三台JN上（node2、node3、node4）启动JN

命令： hadoop-daemon.sh start journalnode

步骤９：在一台NN 执行格式化（如node1，注意查看上面的集群图标，每台机器都代表什么）

格式化命令： hdfs namenode -format
!!启动当前NN
启动命令：hadoop-daemon.sh start namenode

步骤１０：在其它没有格式化的NN上执行同步命令（如node2）

命令： hdfs namenode -bootstrapStandby

步骤１１：启动ZK集群，三台zk（node1、node2、node3）执行

命令：zkServer.sh start
使用ｊｐｓ命令查看启动情况

步骤１２：格式化ZK，在一台NN上执行（如ｎｏｄｅ１）

命令： hdfs zkfc -formatZK
使用ｊｐｓ命令查看启动情况

步骤１３：启动集群

启动：start-dfs.sh
关闭：stop-dfs.sh

ｎｏｄｅ１启动情况

ｎｏｄｅ２启动情况

ｎｏｄｅ３启动情况

ｎｏｄｅ４启动情况

在浏览器查看启动情况：ｎｏｄｅ１（ａｃｔｉｖｅ状态，端口：５００７０）

在浏览器查看启动情况：ｎｏｄｅ２（ｓｔａｎｄｂｙ状态，端口：５００７０）

在浏览器查看启动情况：ｎｏｄｅ３（端口８０８８）

浏览器查看启动情况：ｎｏｄｅ４（端口８０８８）会自动转到ｎｏｄｅ３

补充：

搭建完成之后重启集群
先确定关闭集群：stop-all.sh
重启：
① 启动zk集群：三台zk（node1~3）执行zkServer.sh start
② 启动（node1或node2）：start-all.sh
③ 启动ResourceManager（后两台）
yarn-daemon.sh start resourcemanager

Mithrandir_One

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hadoop高可用HDFS集群搭建详解

说明： Hadoop高可用ＨＤＦＳ集群搭建步骤详解，在搭建的过程中会出现各种各样的问题，大家要养成看日志的习惯，大部分错误在启动或者搭建的过程中都会在日志中体现，（由于日志信息过多，一般错误会在日志最后部分出现建议使用ｔａｉｌ命令查看日志，注意不要粘贴命令，格式问题）集群图表：步骤１：准备工作保证网络可以ｐｉｎｇ通hosts文件要修改（也可不修）防火墙关闭 - 关闭防火墙方法：
复制链接

扫一扫