数据压缩了是指减少表示给定信息量所需数据量的处理。在该定义中,数据和信息是不相同的事情;数据是信息传递的手段。因为相同数量的信息可以用不同数量的数据表示,包含不相关或重复信息的表示称之为冗余数据。二位灰度阵列受如下三种主要类型的数据冗余的影响:
1.编码冗余。
2.时间和空间冗余。
3.不相关的信息。多数二维灰度矩阵中包含有一些被人类视觉系统忽略或与用途无关的信息。
针对上述3种冗余数据进行各种编码,如霍夫曼编码、算术编码及LZW编码。
霍夫曼编码
消除编码冗余的一种最常用技术是霍夫曼编码,霍夫曼编码过程对一组符号产生最佳编码,其概率服从一次只能对一个符号进行编码的限制。利用权重构建哈夫曼树,权重最高的节点,编码最短。
Golomb编码
golomb编码主要作用在非负的整数编码,具有指数衰减概率分布的编码方法。步骤如下所示:
例子:G_{4}9(n=9,m=4)编码
步骤一:商9/4向下取整为2,二进制一元编码为110(11[2个1]+0)
步骤二:k=log_{2}4 = 2,c&