【MapReduce】OutPutFormat(自定义OutputFormat实例)

OutputFormat
OutputFormat 是 MapReduce 输出的基类,所有实现 MapReduce 输出都实现了OutputFormat 接口。下面我们介绍几种常见的 OutputFormat 实现类。
1)文本输出 TextOutputFormat
默认的输出格式是 TextOutputFormat,它把每条记录写为文本行。它的键和值可以是任 意类型,因为 TextOutputFormat 调用 toString()方法把它们转换为字符串。
2)SequenceFileOutputFormat
SequenceFileOutputFormat 将它的输出写为一个顺序文件。如果输出需要作为后续 MapReduce 任务的输入,这便是一种好的输出格式,因为它的格式紧凑,很容易被压缩。
3)自定义OutputFormat 根据用户需求,自定义实现输出。

自定义 OutputFormat
为了实现控制最终文件的输出路径,可以自定义OutputFormat。 要在一个 mapreduce程序中根据数据的不同输出两类结果到不同目录,这类灵活的输出 需求可以通过自定义 outputformat 来实现。
1)自定义OutputFormat 步骤
(1)自定义一个类继承 FileOutputFormat。
(2)改写recordwriter,具体改写输出数据的方法 write()。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值