使用MapReduce运行WordCount案例分享

本文分享了如何使用MapReduce执行WordCount案例,包括数据准备、MR编程规范、编程步骤和具体代码实现。讲解了Mapper和Reducer的核心逻辑,以及序列化协议Writable的重要性。最后提到了在YARN上运行需打包成jar并使用hadoop jar命令。
摘要由CSDN通过智能技术生成

目录

一、准备数据
二、MR的编程规范
三、编程步骤
四、编写程序
    Mapper程序解读

一、准备数据#

注意:准备的数据的格式必须是文本,每个单词之间使用制表符分割。编码必须是utf-8无bom
在这里插入图片描述
二、MR的编程规范#

MR的编程只需要将自定义的组件和系统默认组件进行组合,组合之后运行即可!
三、编程步骤#

①Map阶段的核心处理逻辑需要编写在Mapper中
②Reduce阶段的核心处理逻辑需要编写在Reducer中
③将编写的Mapper和Reducer进行组合,组合成一个Job
④对Job进行设置,设置后运行
四、编写程序#

WCMapper.java

Copy
public class WCMapper extends Mapper<LongWritable, Text, Text, IntWritable>{

private Text out_key=new Text();
private IntWritable out_value=new IntWritable(1);//每个单词出现一次记为1

// 针对输入的每个 keyin-valuein调用一次   (0,hello	hi	hello	hi)
@Override
protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, IntWritable>.Context context) throws Exception {

	System.out.println("keyin:"+key+"----keyout:"+value);
	
	String[] words = v
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值