GZIP压缩原理分析（02）——第二章背景简介

jison_r_wang

已于 2023-10-10 22:40:10 修改

阅读量2.3k

点赞数 6

分类专栏： GZIP压缩文章标签： gzip 压缩算法网络

于 2016-07-30 09:59:32 首次发布

本文链接：https://blog.csdn.net/jison_r_wang/article/details/52068417

版权

GZIP压缩专栏收录该内容

33 篇文章 54 订阅

订阅专栏

以下文字摘自《数据压缩导论（第4版）》：“……数据压缩并不只是对数据的处理，它还是找出数据中已有结构的过程……在数据压缩中，首先要为各种数据中的不同结构建立模型，然后利用这些模型（可能还需要最终感知这些数据的一些应用环境），以更紧凑的方式来表示这些数据。这些结构可能是非常简单的图案，只要划出数据的图形就能看到；也可能比较复杂，需要更为抽象的方法才能体会到。信息常常包含在数据的结构中，而不是包含在数据本身中，数据压缩技术的发展过程与这些结构的发现分不开。”

要研究数据压缩，必须先了解用于衡量压缩性能的指标——压缩率。以下内容是《数据压缩导论（第4版）》中给出的定义（这里只引用该书中对无损压缩有用的部分，至于诸如“失真”等有损压缩的概念，这里暂且不表）：“要衡量一种压缩算法对给定数据集进行压缩时的表现，一种很合理的方法是看一下在压缩前后，数据表示所需比特数之比。这个比值被称为压缩比。假定有一副图像由256像素×256像素的方形阵列组成，存储它需要65536字节。对该图像进行压缩，压缩后的版本需要16384字节。我们就说压缩比为4:1。压缩比还有一种表示方式：将所需数据的减少量表示为原数据大小的百分比。具体到这个例子，以这种方式计算得出的压缩比为75%。”

这里之所以要提到压缩比，完全是因为我在进行相关项目开发时，发现好多研发人员，甚至一些资深研发，如果之前没有搞过压缩的话，很少有人能具体说清压缩比的定义，对压缩比的概念往往比较模糊，有时甚至不清楚压缩比的大小是如何衡量压缩性能的（比如，有人居然认为压缩比大压缩性能反而小，显然这是没有高清压缩比中谁充当比值的分子），如果研发尚且如此，那么又如何与客户交代呢？因此我在这里首先明确压缩比的定义，之后再开始下面的章节。再次提示，这个定义不是我给出的，而是从《数据压缩导论（第4版）》摘录的。

关于压缩的历史，请读者参看该内容：http://blog.jobbole.com/77247/，如果该内容已经过期，请读者在我博客后面留言，我将自己保存的该地址下的内容发过去。

向在压缩领域作出过贡献的各位前辈致敬！！！

jison_r_wang

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
GZIP压缩原理分析（02）——第二章背景简介

以下文字摘自《数据压缩导论（第4版）》：“……数据压缩并不只是对数据的处理，它还是找出数据中已有结构的过程……在数据压缩中，首先要为各种数据中的不同结构建立模型，然后利用这些模型（可能还需要最终感知这些数据的一些应用环境），以更紧凑的方式来表示这些数据。这些结构可能是非常简单的图案，只要划出数据的图形就能看到；也可能比较复杂，需要更为抽象的方法才能体会到。信息常常包含在数据的结构中，而不是包含
复制链接

扫一扫