1.首先,Yarn集群的搭建是建立在高可用完全分布式上进行搭建的
2.修改配置文件(每台服务器都需要修改)
2.1修改配置:mapred-site.xml(此文件在hadoop的etc下的mapred-site.xml中,原名需要在后删除一部分,得到此配置文件)
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
配置资源管理器yarn
2.2yarn-site.xml
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>cluster1</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>node01</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>node02</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>node02:2181,node03:2181,node04:2181</value>
</property>
在启动进程后,在node01执行:start-yarn.sh (bin目录下)
在node02上执行:nyarn-daemon.sh start resourcemanager