七、hadoop mapreduce使用yarn在集群中运行(该文章还需修改)

22 篇文章 0 订阅
15 篇文章 0 订阅

需要在mapred-site.xml文件中配置:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

在yarn-site.xml中配置yarn的ResourceManager节点地址以及其他的NodeManager节点:(这里暂时没给出node节点配置)

<property>
        <!--yarn也是可以集群的,这个resourcemanager是用于配置集群的主节点-->
        <!--yarn的RM的默认端口是多少?-->
        <name>yarn.resourcemanager.hostname</name>
        <value>47.106.181.93</value>
    </property>

    <!--用于配置yarn的普通节点,在数据调度的时候采用什么机制,这里采用的是mapreduce_shuffle机制,yarn数据调用是什么意思?比如mapreduce时,map阶段完成,此时需要把map的结果进行reduce,那么就要把map的结果数据传输到reduce运行的节点,并且对数据怎么分类传输,分组还是什么的,就由该机制决定了-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

 

当使用hadoop jar xx.jar com.xxx.WCRunner运行该jar的job,或者在windows本地直接运行main方法提交job时,

如果没有配置上面的属性,则不在集群中运行mapreduce,而是直接单机运行,此时只需要有文件系统就行(本地文件系统或者hdfs);

如果配置了上面的属性,那么就会使用属性中指定的yarn集群运行mapreduce程序。。当然如果不是在linux中使用hadoop jar命令运行,而是直接在windows用idea运行main方法,那么还需要配置其他的东西才能成功,具体参考:https://mp.csdn.net/postedit/91358435

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值