Kerberos安全认证-连载4-大数据技术组件之搭建HDFS HA集群

最新推荐文章于 2024-01-13 15:24:39 发布

IT贫道

最新推荐文章于 2024-01-13 15:24:39 发布

阅读量444

点赞数

分类专栏： Kerberos安全认证文章标签： hdfs 大数据 hadoop

本文链接：https://blog.csdn.net/qq_32020645/article/details/131064403

版权

Kerberos安全认证专栏收录该内容

12 篇文章 13 订阅

订阅专栏

技术连载系列，前面内容请参考前面连载3内容:https://blog.csdn.net/qq_32020645/article/details/131064218

1. 节点划分

这里安装HDFS版本为3.3.4，搭建HDFS对应的角色在各个节点分布如下：

节点IP	节点名称	NN	DN	ZKFC	JN	RM	NM
192.168.179.4	node1	★		★		★
192.168.179.5	node2	★		★		★
192.168.179.6	node3		★		★		★
192.168.179.7	node4		★		★		★
192.168.179.8	node5		★		★		★

hadoop-3.3.4.tar.gz下载地址:https://download.csdn.net/download/qq_32020645/87867934

2. 安装配置HDFS

1) 各个节点安装HDFS HA自动切换必须的依赖

yum -y install psmisc

2) 上传下载好的Hadoop安装包到node1节点上，并解压

[root@node1 software]# tar -zxvf ./hadoop-3.3.4.tar.gz

3) 在node1节点上配置Hadoop的环境变量

[root@node1 software]# vim /etc/profile

export HADOOP_HOME=/software/hadoop-3.3.4/

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:

#使配置生效

source /etc/profile

4) 配置$HADOOP_HOME/etc/hadoop下的hadoop-env.sh文件

#导入JAVA_HOME

export export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64/

5) 配置$HADOOP_HOME/etc/hadoop下的hdfs-site.xml文件

<name>dfs.nameservices</name>

<value>mycluster</value>

</property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

<name>dfs.ha.namenodes.mycluster</name>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn1</name>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn2</name>

</property>

<name>dfs.namenode.http-address.mycluster.nn1</name>

</property>

<name>dfs.namenode.http-address.mycluster.nn2</name>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://node3:8485;node4:8485;node5:8485/mycluster</value>

</property>

<name>dfs.client.failover.proxy.provider.mycluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/opt/data/journal/node/local/data</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

</configuration>

6) 配置$HADOOP_HOME/ect/hadoop/core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://mycluster</value>

</property>

<!-- Hadoop 数据存放的路径，namenode,datanode 数据存放路径都依赖本路径，不要使用 file:/ 开头，使用绝对路径即可

namenode 默认存放路径：file://${hadoop.tmp.dir}/dfs/name

datanode 默认存放路径：file://${hadoop.tmp.dir}/dfs/data

-->

<name>hadoop.tmp.dir</name>

<value>/opt/data/hadoop/</value>

</property>

<name>ha.zookeeper.quorum</name>

</property>

</configuration>

7) 配置$HADOOP_HOME/etc/hadoop/yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.env-whitelist</name>

<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

</property>

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

<value>mycluster</value>

</property>

<name>yarn.resourcemanager.ha.rm-ids</name>

</property>

<name>yarn.resourcemanager.hostname.rm1</name>

</property>

<name>yarn.resourcemanager.hostname.rm2</name>

</property>

<name>yarn.resourcemanager.webapp.address.rm1</name>

</property>

<name>yarn.resourcemanager.webapp.address.rm2</name>

</property>

<name>yarn.resourcemanager.zk-address</name>

</property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<!--<property>

<name>yarn.nodemanager.resource.detect-hardware-capabilities</name>

</property>-->

</configuration>

8) 配置$HADOOP_HOME/etc/hadoop/mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

9) 配置$HADOOP_HOME/etc/hadoop/workers文件

[root@node1 ~]# vim /software/hadoop-3.3.4/etc/hadoop/workers

node3

node4

node5

10) 配置$HADOOP_HOME/sbin/start-dfs.sh 和stop-dfs.sh两个文件中顶部添加以下参数，防止启动错误

HDFS_DATANODE_USER=root

HDFS_DATANODE_SECURE_USER=hdfs

HDFS_NAMENODE_USER=root

HDFS_JOURNALNODE_USER=root

HDFS_ZKFC_USER=root

11) 配置$HADOOP_HOME/sbin/start-yarn.sh和stop-yarn.sh两个文件顶部添加以下参数，防止启动错误

YARN_RESOURCEMANAGER_USER=root

YARN_NODEMANAGER_USER=root

12) 将配置好的Hadoop安装包发送到其他4个节点

[root@node1 ~]# scp -r /software/hadoop-3.3.4 node2:/software/

[root@node1 ~]# scp -r /software/hadoop-3.3.4 node3:/software/

[root@node1 ~]# scp -r /software/hadoop-3.3.4 node4:/software/

[root@node1 ~]# scp -r /software/hadoop-3.3.4 node5:/software/

也可以在对应其他节点上解压对应的安装包后，只发送对应的配置文件，这样速度较快。

13) 在node2、node3、node4、node5节点上配置HADOOP_HOME

#分别在node2、node3、node4、node5节点上配置HADOOP_HOME

vim /etc/profile

export HADOOP_HOME=/software/hadoop-3.3.4/

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:

#最后记得Source

source /etc/profile

3. 初始化HDFS

#在node3,node4,node5节点上启动zookeeper

zkServer.sh start

#在node1上格式化zookeeper

[root@node1 ~]# hdfs zkfc -formatZK

#在每台journalnode中启动所有的journalnode,这里就是node3,node4,node5节点上启动

hdfs --daemon start journalnode

#在node1中格式化namenode

[root@node1 ~]# hdfs namenode -format

#在node1中启动namenode,以便同步其他namenode

[root@node1 ~]# hdfs --daemon start namenode

#高可用模式配置namenode,使用下列命令来同步namenode(在需要同步的namenode中执行，这里就是在node2上执行):

[root@node2 software]# hdfs namenode -bootstrapStandby

4.启动及停止

#node1上启动HDFS,启动Yarn

[root@node1 sbin]# start-dfs.sh

[root@node1 sbin]# start-yarn.sh

注意以上也可以使用start-all.sh命令启动Hadoop集群。

#停止集群

[root@node1 ~]# stop-dfs.sh

[root@node1 ~]# stop-yarn.sh

注意：以上也可以使用 stop-all.sh 停止集群。

5. 访问WebUI

#访问HDFS : http://node1:50070

#访问Yarn WebUI ：http://node1:8088

欢迎点赞、评论、收藏，关注IT贫道，获取IT技术知识！

IT贫道

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Kerberos安全认证-连载4-大数据技术组件之搭建HDFS HA集群

1. 节点划分

2. 安装配置HDFS

3. 初始化HDFS

​​​​​​​​​​​​​​4.启动及停止

​​​​​​​​​​​​​​5. 访问WebUI

4.启动及停止

5. 访问WebUI