数据压缩实验三——LZW编解码思想及分析

最新推荐文章于 2022-07-10 23:09:56 发布

Avery_Sponge

最新推荐文章于 2022-07-10 23:09:56 发布

阅读量200

点赞数

分类专栏：作业

本文链接：https://blog.csdn.net/m0_52405563/article/details/115964359

版权

作业专栏收录该内容

10 篇文章 0 订阅

订阅专栏

LZW编码思想

步骤1：将词典初始化为包含所有可能的单字符，当前前缀P初始化为空。
步骤2：当前字符C=字符流中的下一个字符。
步骤3：判断P＋C是否在词典中
（1）如果“是”，则用C扩展P，即让P=P＋C，返回到步骤2。
（2）如果“否”，则
输出与当前前缀P相对应的码字W；
将P＋C添加到词典中；
令P=C，并返回到步骤2
在这里插入图片描述
举例编码abcbcabcabcd，初始dictionary为

symbol	decimal
a	1
b	2
c	3
d	4

step	p	c	is p+c in dic?	output p	dic
1	null	a		不处理
2	a	b	no	1	ab:5
3	b	c	no	2	bc:6
4	c	b	no	3	cb:7
5	b	c	yes
6	bc	a	no	6	bca:8
7	a	b	yes
8	ab	c	no	5	abc:9
9	c	a	no	3	ca:10
10	a	b	yes
11	ab	c	yes
12	abc	d	no	9
13	d	null		4

经过编码，得到新的dictionary为

symbol	decimal
a	1
b	2
c	3
d	4
ab	5
bc	6
cb	7
bca	8
abc	9
ca	10

LZW解码思想

步骤1：在开始译码时词典包含所有可能的前缀根。3
步骤2：令CW：=码字流中的第一个码字。
步骤3：输出当前缀-符串string.CW到码字流。
步骤4：先前码字PW：=当前码字CW。
步骤5：当前码字CW：=码字流的下一个码字。
步骤6：判断当前缀-符串string.CW 是否在词典中。
（1）如果”是”，则把当前缀-符串string.CW输出到字符流。
当前前缀P：=先前缀-符串string.PW。
当前字符C：=当前前缀-符串string.CW的第一个字符。
把缀-符串P+C添加到词典。
（2）如果”否”，则当前前缀P：=先前缀-符串string.PW。
当前字符C：=当前缀-符串string.CW的第一个字符。
输出缀-符串P+C到字符流,然后把它添加到词典中。
步骤7：判断码字流中是否还有码字要译。
（1）如果”是”，就返回步骤4。
（2）如果”否”，结束。
在这里插入图片描述
举例解码97, 98, 99, 257, 256, 99, 260, 100，默认dictionary为

decimal	symbol
97	a
98	b
99	c
100	d

演算如下

inout	p	c	is c in dic?	output	dic
97	null	a	yes	a
98	a	b	no	1	ab:5
99	b	c	no	2	BC:6
257	c	b	no	3	cb:7
256	b	c	yes
99	bc	a	no	6	bca:8
260	a	b	yes
100	ab	c	no	5	abc:9

实验步骤

1、写txt文件

在这里插入图片描述

2、设置命令参数得到输出文件out_shorten.txt

在这里插入图片描述

3、选取10种不同格式的文件进行LZW编码

编码前
在这里插入图片描述
编码后

总结

从编码后文件的大小来看，bmp、caj、jar、jpg格式的文件编码后没有得到压缩反而增大了数据量，造成这种情况的原因可能是文件内容重复率低，导致LWZ编码的编码压缩效率不高，甚至编码时生成了新的映射表让文件扩大了。

Avery_Sponge

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据压缩实验三——LZW编解码思想及分析

LZW编码思想步骤1：将词典初始化为包含所有可能的单字符，当前前缀P初始化为空。步骤2：当前字符C=字符流中的下一个字符。步骤3：判断P＋C是否在词典中（1）如果“是”，则用C扩展P，即让P=P＋C，返回到步骤2。（2）如果“否”，则输出与当前前缀P相对应的码字W；将P＋C添加到词典中；令P=C，并返回到步骤2举例编码abcbcabcabcd，初始dictionary为symboldecimala1b2c3d4steppc
复制链接

扫一扫