GIF图片介绍和LZW算法说明
1. GIF格式
GIF图像的文件格式如下:
重点字段介绍:
逻辑屏幕标志符:包含了逻辑屏幕的长宽,是否包含全局颜色列表,背景色等。
全局颜色列表:包含了图片中使用的所有颜色,而图片的数据使用全局颜色列表中的索引代替。
图像块:gif的数据是由数据块组成,每个数据块的长度最大为255
2. LZW算法
全称为“串表压缩算法”,LZW代表了研发该算法的三个人(坑爹啊,还以为是英文缩写)。属于字典编码的一种,最大的优点在于压缩后的数据不需要额外携带字典就可以解压。GIF采用LZW算法进行编码的。
2.1 首先介绍几个相关术语:
数据流:需要进行编码的数据串,GIF中指像素的颜色值。LZW编码时的输入
编码流:数据流编码的结果。LZW编码时的输出
编译表:编码时候的字典表,是动态建立的。
字符:数据流中最基本的单位,GIF中一个像素的颜色在颜色列表中的序号。
字符串:由连续字符组成的,前缀和后缀一起代表了字符串
前缀:也是字符串,但可以为空。具体解释见下文
后缀:也是字符串,一个字符就是后缀,可以为空。具体解释见下文
2.2 编码流程
首先举一个简单的例子,有一个数据流为:abcbabbac
我们为了和数据流的字符进行区别,我们采用1,2,3这样的数字进行编码。数据流中可能出现的字符为,a~z,所以我们初始化编译表,用1~26,代表a~z单个字符。所以对于其它的字符串只能从27进行编码。初始化前缀为空,后缀也为空,编码流为空,编译表为1~26和a~z的对应。
1.2.1 从数据流取字符a作为后缀,前缀为空,字符串为a,在编译表中存在,为1,字符串变前缀。前缀:a;后缀:空;字符串:a;编码流:空;编译表:单个字符的对应(后面不再显示)
1.2.2 取字符b作为后缀,字符串为:ab,编译表中不存在,定义ab为27,前缀输出,后缀变前缀。前缀:b;后缀:空;字符串:b;编码流:1;编译表:27=ab
1.2.3 取字符c作为后缀,字符串为:bc,编译表不存在,定义bc为28,前缀输出,后缀变前缀。前缀:c;后缀:空;字符串:c;编码流:1-2;编译表:27=ab 28=bc
1.2.4 取字符b作为后缀,字符串为:cb,编译表不存在,定义cb为29,前