搭建多节点Hadoop集群，并对NameNode和SecondaryNameNode进程进行分离操作

最新推荐文章于 2024-08-17 00:13:46 发布

Hiwes

最新推荐文章于 2024-08-17 00:13:46 发布

阅读量2.1k

点赞数

分类专栏：大数据相关 Hadoop SecondaryNameNode 文章标签：大数据 Hadoop 进程

本文链接：https://blog.csdn.net/hiwes/article/details/82113045

版权

大数据相关同时被 3 个专栏收录

21 篇文章 0 订阅

订阅专栏

Hadoop

1 篇文章 0 订阅

订阅专栏

SecondaryNameNode

1 篇文章 0 订阅

订阅专栏

主机环境：

Centos7.3（自定义台数，此处举例使用3台）

安装前准备：

JDK：

jdk-8u144-linux-x64.tar.gz

Hadoop：

http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz

在单机模式及小节点集群的Hadoop集群配置，往往NameNode和SecondaryNameNode进程在同一主机上，在企业运营环境中，一旦发生主机宕机等问题，那么整个Hadoop都会瘫痪，对整个大数据的集群会造成极大损失，为此，当节点数大于等于2之后，便可以进行配置，将NameNode和SecondaryNameNode进行分离，使SecondaryNameNode分配到从节点上，降低业务差错。

安装步骤：

配置涉及到Linux操作中配置hosts映射、关闭防火墙、节点间ssh免密认证，需要使用root账户登录各节点，对系统的配置参考前篇博文《Centos7下安装Cloudera Manager5.7.0》，步骤直接跳过，修改映射添加master（作为主节点）,slave1,slave2，并直接开始对Hadoop进行配置：

1.下载并解压：

hadoop-2.6.0-cdh5.7.0.tar.gz

[root@master]# tar -zxvf hadoop-2.6.0-cdh5.7.0.tar.gz -C /opt

2.对hadoop配置环境变量并生效：

[root@master]# vim /etc/profile

export HADOOP_HOME=/opt/hadoop-2.6.0-cdh5.7.0

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME:$PATH

source /etc/profile

3.修改hadoop配置文件：

[root@master hadoop]# cd /app/hadoop-2.6.0-cdh5.7.0/etc/hadoop

[root@master hadoop]# vim core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://master:8020</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/hadoop-2.6.0-cdh5.7.0/tmp</value>

</property>

<name>io.file.buffer.size</name>

</property>

<name>fs.checkpoint.period</name>

</property>

<name>fs.checkpoint.size</name>

</property>

<name>ha.zookeeper.quorum</name>

<value>master:2181,slave1:2181,slave2:2181</value>

</property>

[root@master hadoop]# vim hadoop-env.sh

export JAVA_HOME=/usr/jvm/jdk1.8.0

export HADOOP_LOG_DIR=/opt/hadoop-2.6.0-cdh5.7.0/logs

[root@master hadoop]# vim hdfs-site.xml

<name>dfs.datanode.data.dir</name>

<value>file:/opt/hadoop-2.6.0-cdh5.7.0/dfs/data</value>

</property>

<name>hadoop.tmp.dir</name>

<value>file:/opt/hadoop-2.6.0-cdh5.7.0/tmp</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.blocksize</name>

</property>

<name>dfs.namenode.handler.count</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<name>dfs.http.address</name>

<value>master:50070</value>

</property>

<name>dfs.namenode.secondary.http-address</name>

<value>slave1:50090</value>

</property>

在常规配置之后，添加SecondaryNameNode的http端口，修改为需要放置该进程的节点，如：slave1

[root@master hadoop]# vim mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

[root@master hadoop]# vim slaves

master

slave1

slave2

[root@master]$ vim yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle,spark_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.nodemanager.aux-services.spark_shuffle.class</name>

<value>org.apache.spark.network.yarn.YarnShuffleService</value>

</property>

<name>spark.shuffle.service.port</name>

</property>

<name>yarn.nodemanager.resource.memory-mb</name>

</property>

<name>yarn.nodemanager.resource.cpu_vcores</name>

</property>

<name>yarn.nodemanager.log-dirs</name>

<value>/opt/hadoop-2.6.0-cdh5.7.0/logs</value>

</property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>

</property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

常规配置结束，但是还需要增加一个masters文件，作为SecondaryNameNode的节点，此处设置为slave1：

[root@master hadoop]# vim masters

slave1

到此，所有配置已经完毕，初始化HDFS并启动Hadoop，并连接到slave1查看进程：

[root@master hadoop-2.6.0-cdh5.7.0]# bin/hadoop namenode -format

[root@master hadoop-2.6.0-cdh5.7.0]# sbin/start-all.sh

[root@master hadoop-2.6.0-cdh5.7.0]# ssh slave1

[root@slave1 ~]# jps

配置完成。

Hiwes

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录