大数据之八 hadoop MapReduce on YARN--WordCount

最新推荐文章于 2021-08-03 16:54:41 发布

栖梧九嶷

最新推荐文章于 2021-08-03 16:54:41 发布

阅读量354

点赞数

分类专栏： MapReduce

本文链接：https://blog.csdn.net/xingyao231/article/details/83185643

版权

本文介绍了如何在YARN集群上配置并运行Hadoop MapReduce的经典案例WordCount。首先，详细讲述了YARN集群的配置步骤，然后在eclipse中配置MapReduce环境，接着详细解析了WordCount的map()、reduce()和main()方法的实现。最后，讨论了MapReduce的运行模式，包括本地运行和集群提交，并展示了如何在YARN上查看作业状态及HDFS上的输出结果。

摘要由CSDN通过智能技术生成

前两篇中，我们了解了MapReduce的执行流程及其架构实现，今天我们就在本地通过经典实例WordCount来了解一下MapReduce的编程实现

YARN集群配置

首先我们按照大数据之四 hadoop HDFS HA 高可用的完全分布式搭建好集群环境，jps检查无误
关闭所有节点上的HDFS相关进程

  stop-dfs.sh

配置mapred-site.xml文件（cp mapred-site.xml.template mapred-site.xml）

  <!-- MapReduce的架构体系，这里使用MapReduceV2，即YARN -->
  <property>
          <name>mapreduce.framework.name</name>
          <value>yarn</value>
  </property>

配置yarn-site.xml文件

    <!-- NodeManager上运行的附属服务。需配置成mapreduce_shuffle，才可运行MapReduce程序 -->
 	<property>
           <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
    </property>
    <property>
            <name>yarn.resourcemanager.ha.enabled</name>
            <value>true</value>			<!-- 启用RM的高可用 -->
    </property>
    <property>
            <name>yarn.resourcemanager.cluster-id</name>
            <value>cluster1</value>				<!-- YARN对外提供的服务的id -->
    </property>
    <property>
            <name>yarn.resourcemanager.ha.rm-ids</name>
            <value>rm1,rm2</value>			<!-- 实现RM高可用的节点id -->
    </property>
    <property>
            <name>yarn.resourcemanager.hostname.rm1</name>
            <value>node01</value>				<!-- rm1对应的真实节点 -->
    </property>
    <property>
            <name>yarn.resourcemanager.hostname.rm2</name>
            <value>node02</value>			  <!-- rm2对应的真实节点 -->
    </property>

	<!--配置三台zookeeper的位置信息 -->
    <property>
           <name>yarn.resourcemanager.zk-address</name>
           <value>node02:2181,node03:2181,node04:2181</value>
    </property>

将配置完成的hadoop安装包发送到其他节点，覆盖之前的安装包，也可以先删除之前的安装包

  scp -r hadoop-2.6.5 root@node02:/opt/zgl/
  scp -r hadoop-2.6.5 root@node03:/opt/zgl
  scp -r hadoop-2.6.5 root@node04:/op

最低0.47元/天解锁文章

栖梧九嶷

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录