linux如何链接zlib,linux – 如何使用多个线程进行zlib压缩(相同的输入源)

在多线程环境中,使用ZLIB压缩数据后,尝试直接拼接压缩块导致解压错误。根据ZLIB RFC,每个deflate流都是自终止的,不能简单连接。正确做法是参考pigz的实现,使用Z_SYNC_FLUSH确保块间边界,并处理结束标志。在最后,使用adler32_combine结合所有块的校验和,生成最终的adler32值。
摘要由CSDN通过智能技术生成

我的目标是在并行线程中压缩相同源的数据.

我已经定义了列表中的作业,这些作业具有读取信息(每个作业中500kb-1MB).

我的压缩器线程将使用ZLIB压缩每个块的数据并将其存储在相应作业的outbuf中.

现在,我想合并所有这些并创建一个标准ZLIB格式的输出文件.

从ZLIB RFC和浏览了pigzee的来源后,我明白了

ZLIB标题如下所示

+---+---+

|CMF|FLG| (2 bytes)

+---+---+

+---+---+---+---+

| DICTID | (4 bytes. Present only when FLG.FDICT is set)

+---+---+---+---+

+=====================+

|...compressed data...| (variable size of data)

+=====================+

+---+---+---+---+

| ADLER32 | (4 bytes of variable data)

+---+---+---+---+

就我而言,也没有字典.

所以当我组合两个压缩单元时,所有单元的标题都是相同的.

因此,我正在做以下的操作.

>对于第一个单元,我正在编写标头压缩数据.

>对于最后一个单元的第二个单元,我只写了压缩数据(没有标题和没有预告片)

>完成所有单元后,我使用adlrer32_combine()并将所有作业输出数据的校验和转换为最终的一个adler 32,然后我在底部更新输出文件.

但问题是,我在deflate期间收到错误,说某些地方的数据无效.

有人已经尝试过这样的事吗?任何相关信息都会非常有用.

解决方法:

您不能简单地连接原始deflate数据流.每个放气流都是自终止的,因此解压缩将在第一个流的末尾结束.

您需要更仔细地查看pigz代码以了解如何合并deflate流.您可以使用Z_SYNC_FLUSH完成最后一个块并将其带到字节边界而不结束deflate流.然后,您可以完成放气流,并剥离标记为结束块的最后一个空块.除了应该正常终止的最后一个deflate流.然后,您可以连接一系列n-1个未终止的deflate流和最后一个终止的deflate流.

标签:linux,multithreading,compression,zlib

来源: https://codeday.me/bug/20190519/1137353.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值