Eclipse调用hadoop2运行MR程序

最新推荐文章于 2025-09-03 19:52:03 发布

原创

最新推荐文章于 2025-09-03 19:52:03 发布 · 2.4w 阅读

11 ·

CC 4.0 BY-SA版权

hadoop：hadoop2.2 ，windows myeclipse环境；

Eclipse调用hadoop运行MR程序其实就是普通的java程序可以提交MR任务到集群执行而已。在Hadoop1中，只需指定jt（jobtracker）和fs（namenode）即可，一般如下：

Configuration conf = new Configuration();
conf.set("mapred.job.tracker", "192.168.128.138:9001");
conf.set("fs.default.name","192.168.128.138:9000");

上面的代码在hadoop1中运行是ok的，完全可以使用java提交任务到集群运行。但是，hadoop2却是没有了jt，新增了yarn。这个要如何使用呢？最简单的想法，同样指定其配置，试试。

Configuration conf = new YarnConfiguration();
			  conf.set("fs.defaultFS", "hdfs://node31:9000");
			  conf.set("mapreduce.framework.name", "yarn");
			  conf.set("yarn.resourcemanager.address", "node31:8032");

恩，这样配置后，可以运行，首先是下面的错误：

2014-04-03 21:20:21,568 ERROR [main] util.Shell (Shell.java:getWinUtilsPath(303)) - Failed to locate the winutils binary in the hadoop binary path
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
	at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:278)
	at org.apache.hadoop.util.Shell.getWinUtilsPath(Shell.java:300)
	at org.apache.hadoop.util.Shell.<clinit>(Shell.java:293)
	at org.apache.hadoop.util.StringUtils.<clinit>(StringUtils.java:76)
	at org.apache.hadoop.yarn.conf.YarnConfiguration.<clinit>(YarnConfiguration.java:345)
	at org.fansy.hadoop.mr.WordCount.getConf(WordCount.java:104)
	at org.fansy.hadoop.mr.WordCount.runJob(WordCount.java:84)
	at org.fansy.hadoop.mr.WordCount.main(WordCount.java:47)

这个错误不用管，这个好像是windows调用的时候就会出的错误。

然后是什么权限问题之类的，这个时候就需要去调整下权限，至少我目前是这样做的。调整的权限主要有/tmp 以及运行wordcount的输入、输出目录。命令如下： $HADOOP_HOME/bin/hadoop fs -chmod -R 777 /tmp 。

然后直到你出现了下面的错误，那么，好了，可以说你已经成功了一半了。

2014-04-03 20:32:36,596 ERROR [main] security.UserGroupInformation (UserGroupInformation.java:doAs(1494)) - PriviledgedActionException as:Administrator (auth:SIMPLE) cause:java.io.IOException: Failed to run job : Application application_1396459813671_0001 failed 2 times due to AM Container for appattempt_1396459813671_0001_000002 exited with  exitCode: 1 due to: Exception from container-launch: 
org.apache.hadoop.util.Shell$ExitCodeException: /bin/bash: line 0: fg: no job control

	at org.apache.hadoop.util.Shell.runCommand(Shell.java:464)
	at org.apache.hadoop.util.Shell.run(Shell.java:379)
	at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:589)
	at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:195)
	at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:283)
	at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:79)
	at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:334)
	at java.util.concurrent.FutureTask.run(FutureTask.java:166)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
	at java.lang.Thread.run(Thread.java:724)


.Failing this attempt.. Failing the application.

用上面出现的错误去google，可以得到这个网页：https://issues.apache.org/jira/browse/MAPREDUCE-5655 。恩，对的。这个网页就是我们的solution。

我们分为1、2、3步骤吧。

1. 修改MRapps.java 、YARNRunner.java的源码，然后打包替换原来的jar包中的相应class文件，这两个jar我已经打包，可以在这里下载http://download.csdn.net/detail/fansy1990/7143547 。然后替换集群中相应的jar吧，同时需要注意替换Myeclipse中导入的包。额，说起Myeclipse中的jar包，这里还是先上幅jar包的图吧：

最低0.47元/天解锁文章

1 条评论

dendily 2015.10.13
引用 “调整的权限主要有/tmp 以及运行wordcount的输入、输出目录。命令如下： $HADOOP_HOME/bin/hadoop fs -chmod -R 777 /tmp” 请问楼主，这里的/tmp是什么，HADOOP_HOME/bin/hadoop fs -chmod -R 777 /tmp在windows下执行，还是在hadoop集群上？
- fansy1990回复dendily 2015.10.15
  [reply]dendily[/reply] 参考：http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html#chmod

mackaywang 2015.01.09
您好，您的博文“Eclipse调用hadoop2运行MR程序”中提到的“修改MRapps.java 、YARNRunner.java的源码打包生成的jar文件”是32位的吧？我的是64位ubuntu系统，编译环境为64位的hadoop2.2.0。我用了您博文中的方法后，还是出现那个错误，所以我想问您是否是因为hadoop32位或者64位不同的缘故？如果是，您能否将您修改的MRapps.java 、YARNRunner.java的源码发给我，我对应到64位的hadoop包下面对相应的MRapps.java 、YARNRunner.java源码进行修改。谢谢！
- fansy1990回复mackaywang 2015.01.12
  [reply]mackaywang[/reply] 1.确认命令行提交任务是否可以运行，这个是确认配置文件是否正确的意思； 2. 如果错误确实是org.apache.hadoop.util.Shell$ExitCodeException: /bin/bash: line 0: fg: no job control，那么可以肯定是classpath路径的问题。可以使用下面的思路：参考http://blog.csdn.net/fansy1990/article/details/27526167这里设置断点看看提交的任务的命令以及environment的参数是什么；如果1步骤可运行，那么可以编辑YarnRunner的源代码，打印任务提交的命令以及environment参数，然后把编辑后的源代码替换集群中的相应代码（应该要替换好几个jar包），再和之前的对比看是否有不同； 3. 如果还解决不了，发私信加q（不过个人比较提倡自己解决，这样学的更多）；
- mackaywang回复mackaywang 2015.01.11
  [reply]mackaywang[/reply] 按照您说的这个错误“这个问题是在windows的eclipse作为客户端提交任务到linux Hadoop集群才会出现的问题，如果是linux的eclipse提交任务到linux Hadoop集群则不会出现这样的问题”，那是不是我的hadoop相关文件不需要修改？
- mackaywang回复fansy1990 2015.01.11
  [reply]fansy1990[/reply] 我那个是在ubuntu 64bit系统下eclipse 伪分布式环境跑的程序，根据您的两篇博文http://blog.csdn.net/fansy1990/article/details/42594677和http://blog.csdn.net/fansy1990/article/details/27526167介绍，“Hadoop 集群是在linux环境下的”，但还是出现错误“Job job_1420894123101_0001 failed with state FAILED due to: Application application_1420894123101_0001 failed 2 times due to AM Container for appattempt_1420894123101_0001_000002 exited with exitCode: 1 due to: Exception from container-launch: org.apache.hadoop.util.Shell$ExitCodeException: ”，希望您可以赐教看看问题可能出在哪？谢谢！
- fansy1990回复mackaywang 2015.01.11
  [reply]mackaywang[/reply] 是64 bits的，具体可以参考：http://blog.csdn.net/fansy1990/article/details/27526167 或者http://blog.csdn.net/fansy1990/article/details/42594677

东方伊雪 2015.01.07
想问下楼主，我已经操作到这里，报错Error: Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster，一直解决不了，按照你的方法也不行，想问下，你是怎么弄的，按照你的步骤就可以解决这个错了吗
- fansy1990回复东方伊雪 2015.01.08
  [reply]huanmieuruoshui[/reply] 这个错误就是classpath路径没找到的错误，如果你不嫌麻烦的话，可以在提交的过程中加入断点，一步步调试，查看那个classpath的路径究竟是什么

东方伊雪 2015.01.07
想问下楼主，我已经操作到这里，报错Error: Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster，一直解决不了，按照你的方法也不行，想问下，你是怎么弄的，按照你的步骤就可以解决这个错了吗