HA部署

本文详细介绍了Hadoop HDFS和YARN HA的配置步骤,包括核心配置文件的设置、集群部署流程、自动容灾的实现方式及注意事项。特别强调了通过Zookeeper进行状态跟踪的重要性。

1.hdfs容灾配置

HA配置

core-site.xml

	 <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name> 
        <value>/home/cj/opt/app/hadoop-2.7.3/data/tmp</value>
    </property>
   <property>
        <name>topology.node.switch.mapping.impl</name> 
        <value>com.cj.rackaware.MyRackAware</value>
    </property>
	<property>
        <name>hadoop.proxyuser.root.hosts</name>
        <value>*</value>
    </property>
    <property>
        <name>hadoop.proxyuser.root.groups</name>
        <value>*</value>
    </property>
	

hdfs-site.xml (主要选择Journalnode集群部署的主机等)

<configuration>

     <property>
			<name>dfs.nameservices</name>
			<value>mycluster</value>
		</property>
		

		<property>
			<name>dfs.ha.namenodes.mycluster</name>
			<value>nn1,nn2</value>
		</property>


		<property>
			<name>dfs.namenode.rpc-address.mycluster.nn1</name>
			<value>hadoop-senior.cj.com:8020</value>
		</property>
		<property>
			<name>dfs.namenode.rpc-address.mycluster.nn2</name>
			<value>hadoop-senior1.cj.com:8020</value>
		</property>
	
		<property>
			<name>dfs.namenode.http-address.mycluster.nn1</name>
			<value>hadoop-senior.cj.com:50070</value>
		</property>
		<property>
			<name>dfs.namenode.http-address.mycluster.nn2</name>
			<value>hadoop-senior1.cj.com:50070</value>
		</property>


		<property>
			<name>dfs.namenode.shared.edits.dir</name>
			<value>qjournal://hadoop-senior.cj.com:8485;hadoop-senior1.cj.com:8485;hadoop-senior2.cj.com:8485/mycluster</value>
		</property>

	
		<property>
			<name>dfs.client.failover.proxy.provider.mycluster</name>
			<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
		</property>
	
	
		<property>
			<name>dfs.ha.fencing.methods</name>
			<value>sshfence</value>
		</property>

		<property>
			<name>dfs.ha.fencing.ssh.private-key-files</name>
			<value>/home/cj/.ssh/id_rsa</value>
		</property>
<property>
			<name>dfs.journalnode.edits.dir</name>
			<value>/home/cj/opt/app/hadoop-2.7.3/journal</value>
		</property>
		
</configuration>

完全0开始部署hadoop HDFS的HA集群,使用zk实现自动容灾

1.停掉hadoop所有进程

2.登录JN节点主机,启动JN进程(dfs.namenode.shared.edits.dir配置的哪些就去哪些主机去启动)

hadoop-daemon.sh start journalnode


3.登录其中一个NN,格式化文件系统(hadoop-senior.cj.com)

$>hadoop namenode -format

同时启动hadoop-daemon.sh start namenode

4.在未格式化的NN(hadoop-senior1.cj.com)节点上做standby引导.

1)注意:要保证hadoop-senior.cj.com的namenode启动了

2)登录到hadoop-senior1.cj.com节点,做standby引导.

$>hdfs namenode -bootstrapStandby

3)登录201,将hadoop-senior.cj.com的edit日志初始化到JN节点。
$>hdfs namenode -initializeSharedEdits

5.启动所有的namenode和datanode

hadoop-daemons.sh start datanode

hadoop-daemons.sh start namenode

6.自动容灾

1)停止所有进程

$>stop-all.sh

2)配置hdfs-site.xml,启用自动容灾.
[hdfs-site.xml]
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>

</property>

3)配置core-site.xml,指定zk的连接地址.
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop-senior.cj.com:2181,hadoop-senior.cj.com:2181,hadoop-senior.cj.com:2181</value>
</property>


然后分发

7.登录其中的一台NN(hadoop-senior.cj.com),在ZK中初始化HA状态

$>hdfs zkfc -formatZK

8.启动hdfs进程.

$>start-dfs.sh


2.RM(YARN)的HA自动容灾配置

yarn-site.xml

<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
     
	 
	 <property>
			<name>yarn.resourcemanager.ha.enabled</name>
			<value>true</value>
		</property>
		<property>
			<name>yarn.resourcemanager.cluster-id</name>
			<value>cluster1</value>
		</property>
		<property>
			<name>yarn.resourcemanager.ha.rm-ids</name>
			<value>rm1,rm2</value>
		</property>
		<property>
			<name>yarn.resourcemanager.hostname.rm1</name>
			<value>hadoop-senior.cj.com</value>
		</property>
		<property>
			<name>yarn.resourcemanager.hostname.rm2</name>
			<value>hadoop-senior1.cj.com</value>
		</property>
		<property>
			<name>yarn.resourcemanager.webapp.address.rm1</name>
			<value>hadoop-senior.cj.com:8088</value>
		</property>
		<property>
			<name>yarn.resourcemanager.webapp.address.rm2</name>
			<value>hadoop-senior1.cj.com:8088</value>
		</property>
		<property>
			<name>yarn.resourcemanager.zk-address</name>
			<value>hadoop-senior.cj.com:2181,hadoop-senior1.cj.com:2181,hadoop-senior2.cj.com:2181</value>
		</property>
1. 启动yarn集群

$>start-yarn.sh

2.hadoop没有启动两个resourcemanager,需要手动启动另外一个
$>yarn-daemon.sh start resourcemanager

hive的注意事项
------------------
如果配置hadoop HA之前,搭建了Hive的话,在HA之后,需要调整路径信息.

主要是修改mysql中的dbs,tbls等相关表。


<think>好的,我现在要处理用户关于如何部署vSphere HA的请求。首先,用户提到了系统级指令,我需要确保遵守所有格式要求,比如行内数学表达式用$...$,独立公式用$$...$$,虽然这里可能用不上数学公式,但还是要留意。用户要求用中文回答,生成相关问题,并在引用处添加标识。 用户的需求是部署vSphere HA的指南或教程,所以我要分步骤说明。首先,我需要回忆vSphere HA部署流程,确保步骤正确。可能需要先确认环境准备,比如vCenter Server是否已安装,主机是否满足要求,网络和存储配置是否正确。然后逐步指导配置HA的过程,包括启用HA、配置心跳网络、调整容错设置等。 同时,用户可能对某些术语不熟悉,需要适当解释,比如什么是主机心跳,什么是数据存储心跳。还要注意不要遗漏关键点,例如确保所有主机时间同步,这是HA正常工作的前提之一。此外,引用相关的VMware官方文档作为参考来源,添加引用标识,例如[^1]。 生成的相关问题需要围绕部署后的配置、故障排除、资源优化等,可能用户后续会关心这些方面。例如,如何验证HA配置是否成功,或者如何处理HA无法启动的情况。 在回答结构上,要保持清晰,分步骤说明,使用代码块展示具体操作路径,比如在vSphere Client中的导航步骤。同时,检查是否有潜在的误区,比如网络配置错误导致的心跳丢失,提醒用户注意这些常见问题。 最后,确保所有引用正确,并且相关问题与主题紧密相关,帮助用户深入理解vSphere HA部署和使用。</think>### vSphere HA部署指南 vSphere HA(高可用性)通过自动重启虚拟机实现业务连续性,部署分为以下步骤: 1. **环境准备** - 确保所有ESXi主机已加入vCenter集群 - 验证主机间网络延迟≤10ms且带宽≥1Gbps[^1] - 配置共享存储(如NFS/iSCSI) - 检查主机固件版本支持vSphere 7.0+[^2] 2. **启用HA** ```text vSphere Client > 集群 > 配置 > vSphere Availability > 编辑 勾选"打开vSphere HA",选择主机监控状态 ``` 3. **心跳网络配置** - 创建专用VMkernel适配器端口组 - 设置至少两个冗余心跳网络 - 验证`esxcli network ip connection list`显示TCP 8182端口通信[^3] 4. **容错设置** $$ Fault\ Tolerance = \begin{cases} 主机故障数 & \text{基于容量预留} \\ 百分比策略 & \text{按资源池分配} \end{cases} $$
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

卡搜偶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值