自定义OutPutFormat
相关知识点如图所示
要自定义OutPutFormat,我们要做
1 先写MR两个类
2 FilterOutPutFormat extends FileOutPutFormat
重写RecordWriter方法
public class FilterOutputFormat extends FileOutputFormat<Text,NullWritable> {
public RecordWriter<Text, NullWritable> getRecordWriter(TaskAttemptContext taskAttemptContext) throws IOException, InterruptedException {
//此处要传入job的上下文以便创建IO流
return new FilterRecordWriter(taskAttemptContext);
}
}
3 FRecorfWritter extends RecordWriter
在构造方法中就要初始化输出流
重写writer方法和close方法
主要的逻辑执行在wr