文件压缩有两大好处,节约磁盘空间,加速数据在网络和磁盘上的传输
在重新编译过hadoop的c源码后才可以用谷歌的snappy压缩。
我们可以使用bin/hadoop checknative 来查看我们编译之后的hadoop支持的各种压缩,如果出现openssl为false,那么就在线安装一下依赖包
//查看压缩支持情况 bin/hadoop checknative
//在线安装 yum install openssl-devel
这种压缩对应的java类
压缩格式 |
对应使用的java类 |
DEFLATE |
org.apache.hadoop.io.compress.DeFaultCodec |