在Eclipse上如何进行Map/Reduce分布式计算

Eclipse分布式计算项目构建进行计算数据出现次数

第一步: 在Eclipse中右键项目空白区域,NEW一个新的Other,选择Map/Reduce Project进行创建,输入项目名称后创建,如下图:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
第二步: 在构建出来的项目下右键点击srcOther俩个新的类,一个为Mapper,另一个为Reducer,之后还要创建一个普通的类,用来获取集群中文件路径和加载自己的集群配置文件,如下图
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这里的args[0][1]要写自己的集群中文件的位置,第二个写输出的位置第三步: 在mapper和reduce类中编写方法,最下面会有详细解释,如下图:
在这里插入图片描述

在这里插入图片描述
项目启动时候,在Job1这个类中,会去加载你的集群配置信息,获取你集群Root最高用户权限,job.setJobName可以随意设置一个名字,接下来它会继续加载本类和mapper以及reduce类进行计算

首先他会通过FileInputFormat.setInputPaths获取到你集群文件路径
这个时候在mapper中LongWritable是文件通过Job1发送过来输入到mapper的键,第一个Test是值,第二个Test和IntWritable是要把数据发送到reduce类的键值。

把数据转成字符类型按照空格切割,切割后,context.write底层代码实现会自动把值写入,不需要去进行写入值的操作,之后发送到reduce

reduce接收到数据后会进行一个数据重复计算,计算数据到底重复出现了几次,之后把文件结果进行返回到job1,输出执行成功!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值