hadoop源码一起看——自定义inputformat过程中recordReader对象创建

最新推荐文章于 2021-01-08 19:24:40 发布

蔡师傅冰红茶

最新推荐文章于 2021-01-08 19:24:40 发布

阅读量391

点赞数

分类专栏：大数据文章标签： hadoop

本文链接：https://blog.csdn.net/qq_37354905/article/details/86497723

版权

跟着教程写了一段自定义inputformat的代码，看了有一段有疑问debug了一下确实和我想的一样。先把代码粘出来：
自定义的inputformat：

import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.BytesWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.InputSplit;
import org.apache.hadoop.mapreduce.JobContext;
import org.apache.hadoop.mapreduce.RecordReader;
import org.apache.hadoop.mapreduce.TaskAttemptContext;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

public class InputFormat extends FileInputFormat<NullWritable, BytesWritable>{
	
	
	@Override
	protected boolean isSplitable(JobContext context, Path filename) {
		// TODO Auto-generated method stub
		return false;
	}

	@Override
	public RecordReader<NullWritable, BytesWritable> createRecordReader(InputSplit split, TaskAttemptContext context)
			throws IOException, InterruptedException {
		// TODO Auto-generated method stub
		WholeRecordReader recordReader = new WholeR