MapReduce修改输出的文件名

本文介绍如何在Hadoop MapReduce中自定义输出文件的名称。通过重写TextOutputFormat的setOutputName方法,可以将默认的输出文件名从'part-r-00000'更改为自定义格式,例如'editName-r-00000'。文中提供了实现自定义文件名的具体步骤和代码示例。
摘要由CSDN通过智能技术生成

MapReduce默认输出的文件名称格式如下:part-r-00000

自定义名称,比如editName,则输出的文件名称为:editName-r-0000,此方法没有彻底修改整个文件名,只修改了一部分

方法如下

重写TextOutPutFormat的setOutPutName方法,因为setOutPutName是protected方法,所以只能通过重写的方式来修改

代码如下

/**
 * 
 */
package com.zhen.outPutName;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.JobContext;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

/**
 * @author FengZhen
 * setOutputName是protected方法,所以无法直接调用,只能自定义TextOutPutFormat重写该方法
 */
public class MyOutPutFormat extends TextOutputFormat<Text, IntWritable>{

    protected static void setOutputName(JobContext job, String name) {  
        job.getConfiguration().set(BASE_OUTPUT_NAME, name);  
      }  
}

 

/**
 * 
 */
package com.zhen.outPutName;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

/**
 * @author FengZhen
 * hadoop jar /Users/FengZhen/Desktop/Hadoop/other/mapreduce_jar/OutPutNameTest.jar com.zhen.outPutName.OutPutNameTest /user/hadoop/mapreduce/combinerTest/input /user/hadoop/mapreduce/OutPutNameTest/output/ 
 */
public class OutPutNameTest {

    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        Configuration configuration = new Configuration();
        Job job = new Job(configuration, OutPutNameTest.class.getSimpleName());
        job.setJarByClass(OutPutNameTest.class);
        job.setMapperClass(MapTest.class);
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        
        job.setReducerClass(ReduceTest.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
//设置job的输出类型 job.setOutputFormatClass(MyOutPutFormat.
class); job.setCombinerClass(ReduceTest.class); job.setPartitionerClass(PartitionTest.class); job.setNumReduceTasks(2); //结果名称如下:editName-r-00000,此方法只能修改part这一段 MyOutPutFormat.setOutputName(job, "editName"); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true)?0:1); } }

Map Reduce两个类省略。

转载于:https://www.cnblogs.com/EnzoDin/p/8441107.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值