win7下eclipse运行mapreduce程序

9 篇文章 0 订阅

根据上篇《win7下eclipse连接hadoop》已配置好环境,现创建一个mapreduce程序,通过eclipse远程执行mapreduce工程。

环境

1、windows7、eclipse
2、centos6.6、hadoop版本为CDH5.4.1,4台物理机搭建的集群

1、为了后面方便,在这里修改hosts文件:
这里写图片描述

这里写图片描述

2、新建mapreduce工程
这里写图片描述

这里写图片描述

2.1 配置hadoop的安装路径:
将hadoop的压缩包解压到windows环境中,将该目录配置进eclipse
这里写图片描述

2.2 新建项目 File–New–Other–Map/Reduce Project 命名为MR1, 然后创建类org.apache.hadoop.examples.WordCount,从hadoop中拷贝覆盖
(C:\hadoop\CDH-5.4.1-1.cdh5.4.1.p0.6\share\doc\hadoop-0.20-mapreduce\examples\src\org\apache\hadoop\examples\WordCount.java)

2.3 在src目录下创建log4j.properties文件,内容如下:
这里写图片描述

2.4 将C:\hadoop\CDH-5.4.1-1.cdh5.4.1.p0.6\jars加载进去

2.5 在eclipse中点击WordCount.java,右键,点击Run As—>Run Configurations,配置运行参数,即输入和输出文件夹
这里写图片描述

3 运行
Run on hadoop运行报错:
A) 权限问题
这里写图片描述

解决方案:
创建一个新的用户,该用户名与hadoop用户名一致,用该用户登录,在该环境下运行即可解决
这里写图片描述

B) 缺少插件
这里写图片描述

第一个问题的解决方案有2种:
1)不想重启电脑可以在MapReduce程序里加

System.setProperty("hadoop.home.dir", "C:\hadoop\CDH-5.4.1-1.cdh5.4.1.p0.6")

2)或者设置环境变量

HADOOP_HOME= C:\hadoop\CDH-5.4.1-1.cdh5.4.1.p0.6

追加环境变量path内容:%HADOOP_HOME%/bin

第二个问题的解决方案:
下载相应插件,拷贝到C:\hadoop\CDH-5.4.1-1.cdh5.4.1.p0.6\bin里
这里写图片描述

将相应的xml配置文件放到src目录下:
这里写图片描述
(注:相应的xml配置文件放到src目录下是为了完全分布式运行,如果不放这些配置文件也可以运行,此时并不是完全分布式运行,你会发现job的名称里带有local字样,此时如果想要完全分布式运行,则可将.java文件打成jar包,放入hadoop环境中运行)

至此,运行成功
这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值