hadoop 对数据流的压缩和解压缩

   实现本地文件的压缩上传,命令示例:hadoop  compressFromLocal   /home/uncle_bai/workspace/Testdata  hdfs://localhost:9000/input/test   org.apache.io.compress.GzipCodec

 

public class compressFromLocal {

	public static void main(String[] args) throws IOException, ClassNotFoundException {
		String scrString=args[0];    //本地文件的地址
		String dststrString=args[1]; //hdfs文件系统的文件地址
		String codetypeString=args[2]; //指定编码方式
		Configuration configuration=new Configuration();	
		Class<?> codeClass=Class.forName(codetypeString);
		CompressionCodec codec=(CompressionCodec)ReflectionUtils.newInstance(codeClass, configuration);	
		dststrString=dststrString+codec.getDefaultExtension();   //为生成的压缩文件自动添加后缀
		FileSystem fS=FileSystem.get(URI.create(dststrString), configuration);
		InputStream inputStream=new FileInputStream(new File(scrString));   
		OutputStream outputStream=codec.createOutputStream(fS.create(new Path(dststrString)));
                //压缩文件要用codec.creatOutputStream对输出流进行包装,因为压缩解压缩的动作是在hadoop端进行的,而不是本地进行的
                IOUtils.copyBytes(inputStream, outputStream, configuration);
	}

}

     实现hdfs文件的解压缩。命令如:hadoop decompressFromHdfs hdfs://localhost:9000/input/Testdata.gz

 

 

	public class decompressFromHdfs {
         public static void main(String[] args) throws IOException {
		String srcString=args[0];
		String dString=null;
		Configuration configuration=new Configuration();
		FileSystem fsFileSystem=FileSystem.get(URI.create(srcString), configuration);
		CompressionCodecFactory factory=new CompressionCodecFactory(configuration);
		CompressionCodec codec=factory.getCodec(new Path(srcString));//由读取的路径命获取解码器
		dString=CompressionCodecFactory.removeSuffix(srcString, codec.getDefaultExtension());//自动去除后缀名
		InputStream inputStream=codec.createInputStream(fsFileSystem.open(new Path(srcString)));
		OutputStream outputStream=fsFileSystem.create(new Path(dString));
		IOUtils.copyBytes(inputStream, outputStream, configuration);

	}

}

   CodecPool允许反复使用压缩禾解压缩,分摊创建这些对象需要的开销。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值