MapReduce 的格式输入----SequenceFileInputFormat ---源码分析

本文详细介绍了如何使用SequenceFileInputFormat处理MapReduce的二进制输入,通过分析MaxTempMapper、MaxTempReducer及App的代码,展示了如何配合SequenceFileInputFormat进行数据处理。同时,源码跟踪揭示了从获取切片信息到创建SequenceFileRecordReader,再到Mapper执行过程的关键步骤。
摘要由CSDN通过智能技术生成
MapReduce不仅可以处理文本数据,还可以处理二进制数据。
Hadoop顺序文件存储格式是二进制的键-值对序列,使用顺序文件作为MapReduce的输入,可以使用SequenceFileInputFormat。键-值对是由顺序文件格式决定,只需要保证map的输入格式正确,例如顺序文件的格式是InWritable-Intwritable,那么Mapper的输入格式也一样。

1、 MaxTempMapper
package hadoop.mr.sequenfileinputformat;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/**
 * MaxTempMapper
 */
public class MaxTempMapper extends Mapper<IntWritable, IntWritable, IntWritable,IntWritable> {

   protected void map(IntWritable key, IntWritable value, Context context) throws IOException, InterruptedException {


         context.write(key, value);

   }
}


2、MaxTempReducer
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值