zlib、gzip、zip这三个概念的确比较容易混淆:
1. gzip
gzip是UNIX下的一种数据格式。
gzip是在zlib之上,包了一层,在头和尾添加了一些额外的信息。
gzip- tar.gz。
gzip是一种文件压缩工具(或该压缩工具产生的压缩文件格式),它的设计目标是处理单个
的文件。gzip在压缩文件中的数据时使用的就是zlib。为了保存与文件属性有关的信息,gz
ip需要在压缩文件(*.gz)中保存更多的头信息内容,而zlib不用考虑这一点。但gzip只适
用于单个文件,所以我们在UNIX/Linux上经常看到的压缩包后缀都是*.tar.gz或*.tgz,也
就是先用tar把多个文件打包成单个文件,再用gzip压缩的结果。
2. zlib
zlib是一个开源库,提供了在内存中压缩和解压的函数。
zlib它的设计目标是处理单纯的数据(而不管数据的来源是什么)。
3. zip
zip只是一种数据结构,跟rar同级别的。
zip是适用于压缩多个文件的格式(相应的工具有PkZip和WinZip等),因此,zip文件还要
进一步包含文件目录结构的信息,比gzip的头信息更多。但需要注意,zip格式可采用多种
压缩算法,我们常见的zip文件大多不是用zlib的算法压缩的,其压缩数据的格式与gzip大
不一样。
Java SDK提供了对上述三种压缩技术的支持:Inflater类和Deflater类直接用zlib库对数据压缩/
解压缩,GZIPInputStream类和GZIPOutputStream类提供了对gzip格式的支持,ZipFile、Zi
pInputStream、ZipOutputStream则用于处理zip格式的文件。
所以,你应当根据你的具体需求,选择不同的压缩技术:如果只需要压缩/解压缩数据,你
可以直接用zlib实现,如果需要生成gzip格式的文件或解压其他工具的压缩结果,你就必须
用gzip或zip等相关的类来处理了。
下面是我的程序,把一个文件夹下的文件先打包成一个tar文件,然后再用gzip压缩。