HDFS-HA 集群配置

最新推荐文章于 2024-04-29 21:44:11 发布

落花雨时

最新推荐文章于 2024-04-29 21:44:11 发布

阅读量316

点赞数

分类专栏：大数据文章标签： hadoop big data 大数据 java

本文链接：https://blog.csdn.net/mengxianglong123/article/details/120246841

版权

大数据专栏收录该内容

107 篇文章 52 订阅

订阅专栏

一、环境准备

修改IP
修改主机名及主机名和IP地址的映射
关闭防火墙
ssh免密登录
安装JDK，配置环境变量等

二、集群规划

hadoop102	hadoop103	hadoop104
NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
ZK	ZK	ZK
	ResourceManager
NodeManager	NodeManager	NodeManager

三、配置Zookeeper集群

参考：https://blog.csdn.net/mengxianglong123/article/details/120083021

四、配置HDFS-HA集群

1.官方地址：http://hadoop.apache.org/

2.在opt目录下创建一个ha文件夹

mkdir ha

3.将hadoop解压到此目录

4.配置hadoop-env.sh(etc目录下)

export JAVA_HOME=/opt/module/jdk1.8.0_144
export HDFS_NAMENODE_USER="root"
export HDFS_DATANODE_USER="root"
export HDFS_ZKFC_USER="root"
export HDFS_JOURNALNODE_USER="root"

5.配置core-site.xml

<configuration>
		<!-- 把两个NameNode）的地址组装成一个集群mycluster -->
		<property>
			<name>fs.defaultFS</name>
        	<value>hdfs://mycluster</value>
		</property>

		<!-- 指定hadoop运行时产生文件的存储目录 -->
		<property>
			<name>hadoop.tmp.dir</name>
			<value>/opt/ha/data/tmp</value>
		</property>
		<!-- 指定Zookeeper的地址 -->
		<property>
			<name>ha.zookeeper.quorum</name>
			<value>hadoop102:2181,hadoop103:2181,hadoop104:2181</value>
		</property>
</configuration>

6.配置hdfs-site.xml

<configuration>
	<!-- 完全分布式集群名称 -->
	<property>
		<name>dfs.nameservices</name>
		<value>mycluster</value>
	</property>

	<!-- 集群中NameNode节点都有哪些 -->
	<property>
		<name>dfs.ha.namenodes.mycluster</name>
		<value>nn1,nn2</value>
	</property>

	<!-- nn1的RPC通信地址 -->
	<property>
		<name>dfs.namenode.rpc-address.mycluster.nn1</name>
		<value>hadoop102:9000</value>
	</property>

	<!-- nn2的RPC通信地址 -->
	<property>
		<name>dfs.namenode.rpc-address.mycluster.nn2</name>
		<value>hadoop103:9000</value>
	</property>

	<!-- nn1的http通信地址 -->
	<property>
		<name>dfs.namenode.http-address.mycluster.nn1</name>
		<value>hadoop102:50070</value>
	</property>

	<!-- nn2的http通信地址 -->
	<property>
		<name>dfs.namenode.http-address.mycluster.nn2</name>
		<value>hadoop103:50070</value>
	</property>

	<!-- 指定NameNode元数据在JournalNode上的存放位置 -->
	<property>
		<name>dfs.namenode.shared.edits.dir</name>
	<value>qjournal://hadoop102:8485;hadoop103:8485;hadoop104:8485/mycluster</value>
	</property>

	<!-- 配置隔离机制，即同一时刻只能有一台服务器对外响应 -->
	<property>
		<name>dfs.ha.fencing.methods</name>
		<value>sshfence</value>
	</property>

	<!-- 使用隔离机制时需要ssh无秘钥登录-->
	<property>
		<name>dfs.ha.fencing.ssh.private-key-files</name>
		<value>/home/atguigu/.ssh/id_rsa</value>
	</property>

	<!-- 声明journalnode服务器存储目录-->
	<property>
		<name>dfs.journalnode.edits.dir</name>
		<value>/opt/ha/data/jn</value>
	</property>

	<!-- 关闭权限检查-->
	<property>
		<name>dfs.permissions.enable</name>
		<value>false</value>
	</property>

	<!-- 访问代理类：client，mycluster，active配置失败自动切换实现方式-->
	<property>
  		<name>dfs.client.failover.proxy.provider.mycluster</name>
	<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
	</property>
	
	<!-- 开启自动故障转移 -->
	<property>
		<name>dfs.ha.automatic-failover.enabled</name>
		<value>true</value>
	</property>
</configuration>

7.配置workers

hadoop102
hadoop103
hadoop104

8.拷贝配置好的hadoop环境到其他节点

五、启动集群

1.在所有journalnode节点上启动journalnode

sbin/hdfs --daemon start journalnode

2.随意一个namenode节点服务器执行格式化

bin/hdfs namenode -format

3.启动上一步格式化的namenode

bin/hdfs --daemon start namenode

4.另外两个namenode执行同步信息

bin/hdfs namenode -bootstrapStandby

5.格式化zookeeper节点

bin/hdfs zkfc -formatZK

6.启动HDFS集群

start-dfs.sh

落花雨时

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
HDFS-HA 集群配置

一、环境准备修改IP修改主机名及主机名和IP地址的映射关闭防火墙ssh免密登录安装JDK，配置环境变量等二、集群规划hadoop102hadoop103hadoop104NameNodeNameNodeJournalNodeJournalNodeJournalNodeDataNodeDataNodeDataNodeZKZKZKResourceManagerNodeManagerNodeManagerNodeMana
复制链接

扫一扫