MapReduce任务的几种运行方式

最新推荐文章于 2022-11-28 17:23:15 发布

阿圆007

最新推荐文章于 2022-11-28 17:23:15 发布

阅读量790

点赞数 1

分类专栏： Hadoop 文章标签： Hadoop MapReduce

本文链接：https://blog.csdn.net/lfy9477/article/details/88532358

版权

7 篇文章 0 订阅

订阅专栏

mapreduce job的几种运行模式

hadoop jar wc.jar cn.itheima.hadoop.MainClassRunner

这种方式会将这个job提交到yarn集群上去运行

这种方式可以使job运行在本地，也可以运行在yarn集群
----究竟运行在本地还是在集群，取决于一个配置参数

         mapreduce.framework.name == yarn (local)

----如果确实需要在eclipse中提交到yarn执行，必须做好以下两个设置

a、在Windows中配置Hadoop环境变量
(1)、HADOOP_HOME : E:\Hadoop\hadoop-2.7.1
(2)、path : 添加 %HADOOP_HOME%\bin;
(3)、测试：打开命令行cmd ,输入命令 hadoop version
b、添加文件
(1)、将hadoop-common-2.2.0-bin-master\bin文件夹下的winutils.exe放到hadoop的bin目录下
(3)、把hadoop-common-2.2.0-bin-master\bin文件夹下d的hadoop.dll文件拷贝到C:\Windows\System32下，重启电脑
c、在Eclipse中指明登陆hadoop的用户，
System.setProperty(“HADOOP_USER_NAME”, “hadoop上的用户名”);
或者
右键->Run Configurations->Arguments->VM arguments 加入：-DHADOOP_USER_NAME=root

----a、在windows中找一个地方放一份hadoop的安装包，并配置Hadoop环境变量
----b、根据windows平台的版本（32？64？win7？win8？），替换掉hadoop安装包中的本地库(bin,lib)
----c、mr程序的工程中不要有参数mapreduce.framework.name的设置