hadoop高可靠集群搭建

最新推荐文章于 2024-07-21 22:44:45 发布

置顶 snail_bing

最新推荐文章于 2024-07-21 22:44:45 发布

阅读量780

点赞数

分类专栏： Hadoop 文章标签：大数据 hadoop hadoop集群 HA hadoop集群

本文链接：https://blog.csdn.net/snail_bing/article/details/81774887

版权

Hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

HA hadoop集群完美搭建

此博文可以堪称史上最全、宇宙最详细的HA hadoop集群搭建攻略，是本人呕心制作，亲自搭建完成后的全过程笔录。

在看下面内容之前，希望你先去看一下这几篇博文，熟悉整个hadoop集群环境搭建流程：

linux系统jdk安装教程。

zookeeper集群搭建教程。

hadoop伪分布式集群环境搭建教程。

ok，看完这几篇博文之后相信你已经了解并熟悉了hadoop集群搭建的主要流程，那么我们开始一起来搭建我们的终极hadoop高可用集群环境。下面是一波疯狂操作，请保持良好的注意力。

集群节点分配

准备6台服务器或虚拟机，分配每个节点的资源和需要安装的服务：

Park01

Zookeeper

NameNode (active)

Resourcemanager (active)

Park02

Zookeeper

NameNode (standby)

Park03

Zookeeper

ResourceManager (standby)

Park04

DataNode

NodeManager

JournalNode

Park05

DataNode

NodeManager

JournalNode

Park06

DataNode

NodeManager

JournalNode

安装步骤

1、永久关闭每台机器的防火墙

执行：

service iptables stop

再次执行：

chkconfig iptables off

2、为每台机器配置主机名以及hosts文件

配置主机名，执行：

 vim  /etc/sysconfig/network

然后执行：hostname 主机名，达到不重启生效目的。

配置hosts文件，执行：

vim /etc/hosts

示列：

127.0.0.1   localhost

::1         localhost

192.168.234.21 hadoop01

192.168.234.22 hadoop02

192.168.234.23 hadoop03

192.168.234.24 hadoop04

192.168.234.25 hadoop05

192.168.234.26 hadoop06

3、通过远程命令将配置好的hosts文件 scp到其他5台节点上

执行：

scp  /etc/hosts  hadoop02: /etc

4、为每台机器配置ssh免秘钥登录

执行：

ssh-keygen

  ssh-copy-id root@hadoop01   #分别发送到6台节点上

详细过程参见博文：SSH免密登录配置。

5、前三台机器安装和配置zookeeper

配置conf目录下的zoo.cfg以及创建myid文件，zookeeper集群具体安装步骤参见博文：zookeeper集群搭建教程，这里不做赘述。

6、为每台机器安装jdk和配置jdk环境

jdk安装及环境变量配置参见：linux系统jdk安装教程。

7、为每台机器配置主机名，然后每台机器重启，（如果不重启，也可以配合：hostname hadoop01生效）。

执行： vim /etc/sysconfig/network 进行编辑

8、安装和配置01节点的hadoop

解压安装hadoop安装包，然后进行下面的配置。

配置hadoop-env.sh

配置jdk安装所在目录，配置hadoop配置文件所在目录。

配置core-site.xml

<configuration>

<!--用来指定hdfs的老大，ns为固定属性名，表示两个namenode-->

<property>

<name>fs.defaultFS</name>

<value>hdfs://ns</value>

</property>

<!--用来指定hadoop运行时产生文件的存放目录-->

<property>

<name>hadoop.tmp.dir</name>

<value>/home/software/hadoop-2.7.1/tmp</value>

</property>

<!--执行zookeeper地址-->

<property>

<name>ha.zookeeper.quorum</name>

<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>

</property>

</configuration>

配置hdfs-site.xml

<configuration>

<!--执行hdfs的nameservice为ns,和core-site.xml保持一致-->

<property>

<name>dfs.nameservices</name>

<value>ns</value>

</property>

<!--ns下有两个namenode,分别是nn1,nn2-->

<property>

<name>dfs.ha.namenodes.ns</name>

<value>nn1,nn2</value>

</property>

<!--nn1的RPC通信地址-->

<property>

<name>dfs.namenode.rpc-address.ns.nn1</name>

<value>hadoop01:9000</value>

</property>

<!--nn1的http通信地址-->

<property>

<name>dfs.namenode.http-address.ns.nn1</name>

<value>hadoop01:50070</value>

</property>

<!--nn2的RPC通信地址-->

<property>

<name>dfs.namenode.rpc-address.ns.nn2</name>

<value>hadoop02:9000</value>

</property>

<!--nn2的http通信地址-->

<property>

<name>dfs.namenode.http-address.ns.nn2</name>

<value>hadoop02:50070</value>

</property>

<!--指定namenode的元数据在JournalNode上的存放位置,这样，namenode2可以从jn集群里获取最新的namenode的信息，达到热备的效果-->

<property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hadoop04:8485;hadoop05:8485;hadoop06:8485/ns</value>

</property>

<!--指定JournalNode存放数据的位置-->

<property>

<name>dfs.journalnode.edits.dir</name>

<value>/home/software/hadoop-2.7.1/journal</value>

</property>

<!--开启namenode故障时自动切换-->

<property>

<name>dfs.ha.automatic-failover.enabled</name>

<value>true</value>

</property>

<!--配置切换的实现方式-->

<property>

<name>dfs.client.failover.proxy.provider.ns</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<!--配置隔离机制-->

<property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<!--配置隔离机制的ssh登录秘钥所在的位置-->

<property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/root/.ssh/id_rsa</value>

</property>



<!--配置namenode数据存放的位置,可以不配置，如果不配置，默认用的是core-site.xml里配置的hadoop.tmp.dir的路径-->

<property>

<name>dfs.namenode.name.dir</name>

<value>file:///home/software/hadoop-2.7.1/tmp/namenode</value>

</property>

<!--配置datanode数据存放的位置,可以不配置，如果不配置，默认用的是core-site.xml里配置的hadoop.tmp.dir的路径-->

<property>

<name>dfs.datanode.data.dir</name>

<value>file:///home/software/hadoop-2.7.1/tmp/datanode</value>

</property>


<!--配置block副本数量-->

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

<!--设置hdfs的操作权限，false表示任何用户都可以在hdfs上操作文件-->

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>



</configuration>

配置mapred-site.xml

<configuration>

<property>

<!--指定mapreduce运行在yarn上-->

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

配置yarn-site.xml

<configuration>

<!-- 开启YARN HA -->

<property>

<name>yarn.resourcemanager.ha.enabled</name>

<value>true</value>

</property>



<!-- 指定两个resourcemanager的名称 -->

<property>

<name>yarn.resourcemanager.ha.rm-ids</name>

<value>rm1,rm2</value>

</property>



<!-- 配置rm1，rm2的主机 -->

<property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>hadoop01</value>

</property>



<property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>hadoop03</value>

</property>



<!--开启yarn恢复机制-->

<property>

<name>yarn.resourcemanager.recovery.enabled</name>

<value>true</value>

</property>



<!--执行rm恢复机制实现类-->

<property>

<name>yarn.resourcemanager.store.class</name>

<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

</property>



<!-- 配置zookeeper的地址 -->  

<property>

<name>yarn.resourcemanager.zk-address</name>

<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>

<description>For multiple zk services, separate them with comma</description>

</property>



<!-- 指定YARN HA的名称 -->

<property>

<name>yarn.resourcemanager.cluster-id</name>

<value>yarn-ha</value>

</property>



<property>

<!--指定yarn的老大 resoucemanager的地址-->

<name>yarn.resourcemanager.hostname</name>

<value>hadoop03</value>

</property>

<property>

<!--NodeManager获取数据的方式-->

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

配置slaves文件

hadoop04
hadoop05
hadoop06

配置hadoop的环境变量（可不配）

JAVA_HOME=/home/software/jdk1.8

HADOOP_HOME=/home/software/hadoop-2.7.1

CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export JAVA_HOME PATH CLASSPATH HADOOP_HOME

9、根据配置文件，创建相关的文件夹，用来存放对应数据

在hadoop-2.7.1目录下创建:

①journal目录

②创建tmp目录

③在tmp目录下，分别创建namenode目录和datanode目录

10、通过scp 命令，将hadoop安装目录远程copy到其他5台机器上

比如向hadoop02节点传输：

scp -r  hadoop-2.7.1  hadoop02:/home/software

Hadoop集群启动

1、启动zookeeper集群

在Zookeeper安装目录的bin目录下执行：

sh zkServer.sh start

2、格式化zookeeper

在zk的leader节点上执行：

hdfs zkfc -formatZK

这个指令的作用是在zookeeper集群上生成hadoop-ha节点（ns节点）。

注：3--9步可以用一步来替代：进入hadoop安装目录的sbin目录，执行：start-dfs.sh 。但建议还是按部就班来执行，比较可靠。

3、启动journalnode集群

在04、05、06节点上，切换到hadoop安装目录的bin目录下，执行：

sh hadoop-daemons.sh start journalnode

然后执行jps命令查看：

4、格式化01节点的namenode

在01节点上执行：

hadoop namenode -format

5、启动01节点的namenode

在01节点上执行：

hadoop-daemon.sh start namenode

6、把02节点的 namenode节点变为standby namenode节点

在02节点上执行：

hdfs namenode  -bootstrapStandby

7、启动02节点的namenode节点

在02节点上执行：

hadoop-daemon.sh start namenode

8、在04,05,06节点上启动datanode节点

在04,05,06节点上执行：

 hadoop-daemon.sh start datanode

9、启动zkfc（启动FalioverControllerActive)

在01,02节点上执行：

hadoop-daemon.sh start zkfc

10、在01节点上启动主Resourcemanager

在01节点上执行：

start-yarn.sh

启动成功后，04,05,06节点上应该有nodemanager 的进程。

11、在03节点上启动副 Resoucemanager

在03节点上执行：

yarn-daemon.sh start resourcemanager

测试

输入地址：http://192.168.234.21:50070，查看namenode的信息，是active状态的

输入地址：http://192.168.234.22:50070，查看namenode的信息，是standby状态

然后停掉01节点的namenode,此时返现standby的namenode变为active。

查看yarn的管理地址

http://192.168.234.21:8088（节点01的8088端口）

以上就是HA hadoop集群搭建的全部内容，呕心制作，如有疑问和建议请留言。

snail_bing

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hadoop高可靠集群搭建

HA hadoop集群完美搭建

集群节点分配

安装步骤

1、永久关闭每台机器的防火墙

2、为每台机器配置主机名以及hosts文件

3、通过远程命令将配置好的hosts文件 scp到其他5台节点上

4、为每台机器配置ssh免秘钥登录

5、前三台机器安装和配置zookeeper

6、为每台机器安装jdk和配置jdk环境

7、为每台机器配置主机名，然后每台机器重启，（如果不重启，也可以配合：hostname hadoop01生效）。

8、安装和配置01节点的hadoop

9、根据配置文件，创建相关的文件夹，用来存放对应数据

10、通过scp 命令，将hadoop安装目录远程copy到其他5台机器上

Hadoop集群启动

1、启动zookeeper集群

2、格式化zookeeper

3、启动journalnode集群

4、格式化01节点的namenode

5、启动01节点的namenode

6、把02节点的 namenode节点变为standby namenode节点

7、启动02节点的namenode节点

8、在04,05,06节点上启动datanode节点

9、启动zkfc（启动FalioverControllerActive)

10、在01节点上启动 主Resourcemanager

11、在03节点上启动副 Resoucemanager

测试

10、在01节点上启动主Resourcemanager