压缩
好处:1、减少存储磁盘空间 2、降低IO(网络的IO和磁盘的IO) 3、加快数据在磁盘和网络中的传输速度,从而提高系统的处理速度
坏处 由于使用数据时,需要先将数据解压,加重CPU负荷
本文主要查看hadoop的压缩模式:从原理上知道各压缩模式具体的压缩比和压缩开销时间,及如何选择:
- 目录
- 1 非源码编译下压缩模式情况:
- 2 添加压缩方式:
- 3压缩模式对比
- 4如何选择压缩模式:
1.非源码编译下hadoop下压缩模式:
cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/bin
hadoop checknative
2: 添加压缩方式:
有两种方式可以添加成功压缩模式:1,源码编码相应压缩,2.拷贝其他人编译好Native到相应目录(节约时间先这种),并配置好相应的配置文件。
cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/lib
tar -xzvf native.tar.gz native