zlib库使用简单讲解

最新推荐文章于 2025-10-08 01:03:16 发布

转载最新推荐文章于 2025-10-08 01:03:16 发布 · 4.5w 阅读

本文介绍了zlib库的基本功能，包括压缩和解压方法、数据结构和关键API。详细解析了zlib库中的压缩函数compress和解压函数uncompress，以及高级的流式压缩和解压流程。此外还介绍了如何使用zlib生成gzip格式的文件。

1.zlib库简介

zlib 是通用的压缩库，提供了一套 in-memory 压缩和解压函数，并能检测解压出来的数据的完整性(integrity)。zlib 也支持读写 gzip (.gz) 格式的文件。源码网址：http://www.gzip.org/zlib/。

默认且目前仅使用deflate算法压缩data部分；deflate是一种压缩算法,是huffman编码的一种加强。

2、zlib中函数解析

（1）压缩：
int compress(unsigned char * dest, unsigned long * destLen, unsigned char *source, unsigned long sourceLen);

dest：压缩后数据保存的目标缓冲区
destLen：目标缓冲区的大小（必须在调用前设置，并且它是一个指针）
source：要压缩的数据
sourceLen：要压缩的数据长度
compress()函数成功返回Z_OK，如果内存不够，返回Z_MEM_ERROR，如果目标缓冲区太小，返回Z_BUF_ERROR

int compress2 (Bytef *dest, uLongf *destLen, const Bytef *source, uLongsourceLen, int level);
level: 相比上面一个增加了压缩级别

（2）解压缩：
int uncompress(unsigned char * dest, unsigned long * destLen, unsignedchar * source, unsigned long sourceLen);

dest：解压后数据保存的目标缓冲区
destLen：目标缓冲区的大小（必须在调用前设置，并且它是一个指针）
source：要解压的数据
sourceLen：要解压的数据长度
uncompress()函数成功返回Z_OK，如果内存不够，返回Z_MEM_ERROR，如果目标缓冲区太小，返回Z_BUF_ERROR，如果要解压的数据损坏或不完整，返回Z_DATA_ERROR。

压缩和解压缩的例子可以参照Lib库中的函数test_compress。

zlib使用过程

压缩过程：deflateInit() ->deflate() ->deflateEnd(); 对应的解压过程 inflateInit() -> inflate() -> inflateEnd();

压缩过程：deflateInit2() ->deflate() ->deflateEnd(); 对应的解压过程 inflateInit2() -> inflate()-> inflateEnd();

常用的数据结构

typedef struct z_stream_s {

z_const Bytef *next_in; // 将要压缩数据的首地址

uInt avail_in; // 将要压缩数据的长度

uLong total_in; // 将要压缩数据缓冲区的长度

Bytef *next_out; // 压缩后数据保存位置。

uInt avail_out; // 压缩后数据的长度

uLong total_out; // 压缩后数据缓冲区的大小

z_const char *msg; // 存放最近的错误信息，NULL表示没有错误

struct internal_state FAR*state; /* not visible by applications */

alloc_func zalloc; /* used toallocate the internal state */

free_func zfree; /* used to free theinternal state */

voidpf opaque; /* private data object passed tozalloc and zfree */

int data_type; // 表示数据类型，文本或者二进制

uLong adler; /* adler32 value of the uncompressed data */

uLong reserved; /* reserved for future use */

} z_stream;

常用的函数
include: zlib.h

int deflateInit ((z_streamp strm, int level));
description: 初始化压缩状态，关联相关的z_stream数据结构和压缩比例

parameter:
strm: 要关联的z_stream数据结构
level：压缩比例，压缩级别是一个0-9的数字，0压缩速度最快（压缩的过程），9压缩速度最慢，压缩率最大，0不压缩数据

int deflateInit2 ((z_streamp strm, int level, int method, int windowBits, int memLevel, int strategy));
description: 压缩的初始化

parameter：
strm:   关联的数据结构
level: 压缩级别,压缩级别是一个0-9的数字，0压缩速度最快（压缩的过程），9压缩速度最慢，压缩率最大，0不压缩数
method: 压缩的模式，现在只有一种。Z_DEFLATED（表示数字8）
windowBits: 表示处理raw deflate的方法。windowBits为8..15，也可以为-8...-15。当值为16时，将会加上一个简单gzip头部和尾部。
memLevel:   指定的内部压缩状态，应该分配多少内存。 memLevel=1使用的最小内存，但很慢，降低了压缩比; memLevel=9使用的最大内存以获得最佳的速度。默认值是8。请参阅作为的函数windowBits和memLevel的使用的总内存zconf.h。
strategy:   压缩的策略

int deflate ((z_streamp strm, int flush));
description: 压缩数据

parameter:
strm: 关联的数据结构，要压缩的数据、长度、压缩数据的存放位置和可用大小，都在其中设置的
flush: 采用何种法师将压缩的数据写到缓冲区中。

int deflateEnd ((z_streamp strm))
description: 压缩结束

parameter:
strm: 关联的数据结构，释放资源

基本函数：
int deflateInit (z_streamp strm, int level);
int deflate (z_streamp strm, int flush);
int deflateEnd (z_streamp strm);
int inflateInit (z_streamp strm);
int inflate (z_streamp strm, int flush);
int inflateEnd (z_streamp strm);

关键函数是deflate进行压缩，inflate进行解压。

deflate函数有两个参数，stream和flush。stream是一个结构体变量，有next_in、avail_in、next_out、avail_out这四个变量。next_in表示当前输入的字节数组，avail_in表示当前可用的输入字节数；next_out表示当前输出的字节数组,avail_out表示当前可用的输出字节数。当输入数据没有结束时flush设为Z_NO_FLUSH，否则设为Z_FINISH。next_out要至少比next_in大0.0015%。

inflate函数参数和deflate相同，但flush总是设为Z_NO_FLUSH。

deflate和inflate的例子参照example.c中的test_deflate和test_inflate函数

gzip(*.gz)档案格式几乎是Linux下的标准格式了，有人认为bzip2的压缩率比gzip来得高。一般来说，这个说法大致正确，不过根据我个人的经验，有一半以上的档案，bzip2没有比gzip的压缩率来得高，有少数状况下，gzip压缩率反而比bzip2来的高。
zlib是个支援gzip档案格式的函数库，它使得gz档的存取就犹如开档关档一样地容易，您可以很容易地为您的程序加入gz档的支援。

函数：

gzFilegzopen (const char *path, const char *mode);
开启一个gzip(*.gz)档。
mode叁数可为"rb"或"wb"。
另外也可包含压缩程度如"wb9"。
用'f'作为过滤资料，如"wb6f"。
用'h'可指定Huffman only压缩，如"wb1h"
gzopen亦可用於读取非压缩的gzip档案格式，在这种状况下，gzread会直接读取，而不进行解压缩。

int gzread (gzFile file,voidp buf, unsigned len);
与read的用法相同。

int gzwrite (gzFile file,const voidp buf, unsigned len);
与write用法相同。

int gzprintf (gzFile file,const char *format, ...);
与fprintf用法相同。

char * gzgets (gzFile file,char *buf, int len);
与fgets用法相同。

int gzputc (gzFile file, intc);
与fputc用法相同。

int gzgetc (gzFilefile);
与fgetc用法相同。

int gzflush (gzFile file, intflush);
与fflush作用相同。

z_off_t gzseek (gzFile file,z_off_t offset, int whence);
whence不支援SEEK_END

如果档案是开启为"读取"，则SEEK_SET及SEEK_CUR，向前及向後均支援，不过很慢就是了。
如果档案是开启为"写入"，仅支援向前SEEK。

int gzrewind (gzFilefile);
与gzseek(file, 0L, SEEK_SET)相同作用，仅在读取时有效。

z_off_t gztell (gzFilefile);
返回值 : 目前档案位置(解压缩後的位置)

int gzeof (gzFilefile);
返回值 : 1 - EOF, 0 - not EOF

int gzclose (gzFilefile);
关闭档案
返回值 : zlib error number

====================================================================

zlib是一个通用的压缩开源库，提供了在内存中压缩和解压的函数，包括对解压后数据的校验。目前版本的zlib只支持deflate方法，但是其它的方法将会被添加进来并且拥有同样的接口。

—— zlib manaul

deflate算法在rfc1951中有详细的说明。

zlib同时又是一种数据格式，使用zlib库压缩后的数据会在deflate数据的头和尾添加信息，形成zlib格式的数据。

gzip也是一种数据压缩格式，可以大体分为头部，数据部和尾部三个部分，其中头部和尾部主要是一些文档属性和校验信息（rfc1952），数据部主要是用deflate方法压缩得到的数据。

zlib库默认的压缩方法并不是gzip的，而是zlib的，因此使用zlib压缩得到gzip格式的数据有两种方法：

1. 使用zlib提供的gz***系列函数可以直接把想要的内容写入一个磁盘gzip文件；

2. 如果想在内存中生成gzip格式的数据，可以在初始化的时候调用inflateInit2函数，并指定为gzip格式，代码如下：

z_stream d_stream;
d_stream.zalloc = NULL;
d_stream.zfree = NULL;
d_stream.opaque = NULL;
int ret = deflateInit2(&d_stream, Z_DEFAULT_COMPRESSION, Z_DEFLATED, DEFAULT_WINDOWSIZE, DEFAULT_MEMLEVEL, Z_DEFAULT_STRATEGY);
if (Z_OK != ret)
{
printf("init deflate error\n");
return ret;

}

之后，用deflate压缩出来的数据就是gzip的了

gzip的参照example.c中的test_gzio函数，最终会生成一个foo.gz的压缩包。并能够通过gzread读出压缩中的数据。