mapreduce程序的压缩实现

本文根据《权威指南》第二版的MaxTemperatureWithCompression案例,探讨MapReduce如何处理压缩输入及输出。当MapReduce接收压缩输入文件时,会自动识别并解压;若需压缩输出,可通过配置mapred.output.compress为true,并指定compressed.output.compression.codec,或者在代码中利用FileOutputFormat静态方法设定压缩方式。
摘要由CSDN通过智能技术生成

案例是按照权威指南第二版的MaxTemperatureWithCompression进行的。

输入:

当压缩文件做为mapreduce的输入时,mapreduce将自动通过扩展名找到相应的codec对其解压。

输出:

当mapreduce的输出文件需要压缩时,

1.可以更改mapred.output.compress为true,mapped.output.compression.codec为想要使用的codec的类名就可以了,

2.可以在代码中指定,通过调用FileOutputFormat的静态方法去设置这两个属性,我们来看代码:

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.compress.CompressionCodec;
import org.apache.hadoop.io.compress.GzipCodec;
impo
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值