大数据之八 hadoop MapReduce on YARN--WordCount

本文介绍了如何在YARN集群上配置并运行Hadoop MapReduce的经典案例WordCount。首先,详细讲述了YARN集群的配置步骤,然后在eclipse中配置MapReduce环境,接着详细解析了WordCount的map()、reduce()和main()方法的实现。最后,讨论了MapReduce的运行模式,包括本地运行和集群提交,并展示了如何在YARN上查看作业状态及HDFS上的输出结果。
摘要由CSDN通过智能技术生成

前两篇中,我们了解了MapReduce的执行流程及其架构实现,今天我们就在本地通过经典实例WordCount来了解一下MapReduce的编程实现

YARN集群配置

  1. 首先我们按照大数据之四 hadoop HDFS HA 高可用的完全分布式搭建好集群环境,jps检查无误

  2. 关闭所有节点上的HDFS相关进程

  stop-dfs.sh
  1. 配置mapred-site.xml文件(cp mapred-site.xml.template mapred-site.xml
  <!-- MapReduce的架构体系,这里使用MapReduceV2,即YARN -->
  <property>
          <name>mapreduce.framework.name</name>
          <value>yarn</value>
  </property>
  1. 配置yarn-site.xml文件
    <!-- NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序 -->
 	<property>
           <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
    </property>
    <property>
            <name>yarn.resourcemanager.ha.enabled</name>
            <value>true</value>			<!-- 启用RM的高可用 -->
    </property>
    <property>
            <name>yarn.resourcemanager.cluster-id</name>
            <value>cluster1</value>				<!-- YARN对外提供的服务的id -->
    </property>
    <property>
            <name>yarn.resourcemanager.ha.rm-ids</name>
            <value>rm1,rm2</value>			<!-- 实现RM高可用的节点id -->
    </property>
    <property>
            <name>yarn.resourcemanager.hostname.rm1</name>
            <value>node01</value>				<!-- rm1对应的真实节点 -->
    </property>
    <property>
            <name>yarn.resourcemanager.hostname.rm2</name>
            <value>node02</value>			  <!-- rm2对应的真实节点 -->
    </property>

	<!--配置三台zookeeper的位置信息 -->
    <property>
           <name>yarn.resourcemanager.zk-address</name>
           <value>node02:2181,node03:2181,node04:2181</value>
    </property>
  1. 将配置完成的hadoop安装包发送到其他节点,覆盖之前的安装包,也可以先删除之前的安装包
  scp -r hadoop-2.6.5 root@node02:/opt/zgl/
  scp -r hadoop-2.6.5 root@node03:/opt/zgl
  scp -r hadoop-2.6.5 root@node04:/op
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值