GZIP压缩原理分析(02)——第二章 背景简介

以下文字摘自《数据压缩导论(第4版)》:“……数据压缩并不只是对数据的处理,它还是找出数据中已有结构的过程……在数据压缩中,首先要为各种数据中的不同结构建立模型,然后利用这些模型(可能还需要最终感知这些数据的一些应用环境),以更紧凑的方式来表示这些数据。这些结构可能是非常简单的图案,只要划出数据的图形就能看到;也可能比较复杂,需要更为抽象的方法才能体会到。信息常常包含在数据的结构中,而不是包含在数据本身中,数据压缩技术的发展过程与这些结构的发现分不开。” 

要研究数据压缩,必须先了解用于衡量压缩性能的指标——压缩率。以下内容是《数据压缩导论(第4版)》中给出的定义(这里只引用该书中对无损压缩有用的部分,至于诸如“失真”等有损压缩的概念,这里暂且不表):“要衡量一种压缩算法对给定数据集进行压缩时的表现,一种很合理的方法是看一下在压缩前后,数据表示所需比特数之比。这个比值被称为压缩比。假定有一副图像由256像素×256像素的方形阵列组成,存储它需要65536字节。对该图像进行压缩,压缩后的版本需要16384字节。我们就说压缩比为4:1。压缩比还有一种表示方式:将所需数据的减少量表示为原数据大小的百分比。具体到这个例子,以这种方式计算得出的压缩比为75%。” 

这里之所以要提到压缩比,完全是因为我在进行相关项目开发时,发现好多研发人员,甚至一些资深研发,如果之前没有搞过压缩的话,很少有人能具体说清压缩比的定义,对压缩比的概念往往比较模糊,有时甚至不清楚压缩比的大小是如何衡量压缩性能的(比如,有人居然认为压缩比大压缩性能反而小,显然这是没有高清压缩比中谁充当比值的分子),如果研发尚且如此,那么又如何与客户交代呢?因此我在这里首先明确压缩比的定义,之后再开始下面的章节。再次提示,这个定义不是我给出的,而是从《数据压缩导论(第4版)》摘录的。 

关于压缩的历史,请读者参看该内容:http://blog.jobbole.com/77247/,如果该内容已经过期,请读者在我博客后面留言,我将自己保存的该地址下的内容发过去。 

向在压缩领域作出过贡献的各位前辈致敬!!!

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值