大数据学习——WordCount案例分析(下)

本文深入探讨大数据WordCount案例,重点分析Mapper类中的IntWritable和Text类,以及Mapper的map方法中Context对象的角色。Mapper通过context.write()输出单词和计数,而StringTokenizer用于字符串分隔。接着,讲解Reducer的reduce方法,说明如何处理键值对,将单词与对应的一系列计数值整合。

Mapper类中的成员方法及对象

IntWritable类:
public class IntWritable
extends Object
implements WritableComparable
是WritableComparable接口的实现类并继承了object类,此类的有参构造方法为IntWritable(int value)。

Text类:
set方法其中的一种重载形式:

set(String string)
Set to contain the contents of a string.

map方法:
在写Mapper的继承类时,要重写Mapper类里的map方法,其中有一个Context参数,Mapper.Context类里的构造方法为:

public Mapper.Context(Configuration conf,
                      TaskAttemptID taskid,
                      RecordReader<KEYIN,VALUEIN> reader,
                      RecordWriter<KEYOUT,VALUEOUT> writer,
                      OutputCommitter committer,
                      StatusReporter reporter,
                      InputSplit split)
               throws IOException,
                      InterruptedException

其中的RecordReader参数用来获取输入信息,
InputSplit参数保存了输入文件的路径、范围及位置信息,
RecordWriter参数保存了处理后即将输出的信息,
Sta

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值