2.2 Hadoop-MapReduce配置YARN环境

MapReduce是一个计算框架,可分为5个阶段
split-------Map------sort(洗牌)------reduce-----------数据输出
1,把需要分析的数据切割成片段,每个数据片段不能超过一个Block块
2,Map任务阶段,把切割好的数据片段读进来进行分析,有多少个片段就有多少任务,平行进行
3,洗牌阶段,把Map输出的数据进行排序,分组,分区等,不改变数据结构
4,reduce阶段,自己写处理代码,默认启动一个
5,输出阶段,决定reduce执行结果放哪,默认输出到HDFS某个节点

配置YARN环境(/hadoop-2.5.2/etc/hadoop/):
mapred-site.xml:复制模版创建
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

yarn-site.xml:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>cluster1</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</name> / /定义resourcemanager服务器
<value>node1</value> //自动定义datanode为NodeManager
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name> //定义resourcemanager服务器
<value>node2</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value> node2:4180,node3:4180,node4:4180</value> //注意zookeeper的端口号
</property>

修改完成,scp到其他几个服务器
/hadoop-2.5.2/sbin下
start-yarn.sh 默认启动所有resourcemanager和datamanager节点,当前启动的服务器为resourcemanager
./yarn-daemon.sh start resourcemanager 单独启动resourcemanager节点

启动./start-all 需要先启动zookeeper
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值