数据压缩实验三——LZW编解码思想及分析

LZW编码思想

步骤1:将词典初始化为包含所有可能的单字符,当前前缀P初始化为空。
步骤2:当前字符C=字符流中的下一个字符。
步骤3:判断P+C是否在词典中
(1)如果“是”,则用C扩展P,即让P=P+C,返回到步骤2。
(2)如果“否”,则
输出与当前前缀P相对应的码字W;
将P+C添加到词典中;
令P=C,并返回到步骤2
在这里插入图片描述
举例编码abcbcabcabcd,初始dictionary为

symboldecimal
a1
b2
c3
d4
steppcis p+c in dic?output pdic
1nulla不处理
2abno1ab:5
3bcno2bc:6
4cbno3cb:7
5bcyes
6bcano6bca:8
7abyes
8abcno5abc:9
9cano3ca:10
10abyes
11abcyes
12abcdno9
13dnull4

经过编码,得到新的dictionary为

symboldecimal
a1
b2
c3
d4
ab5
bc6
cb7
bca8
abc9
ca10

LZW解码思想

步骤1:在开始译码时词典包含所有可能的前缀根。3
步骤2:令CW:=码字流中的第一个码字。
步骤3:输出当前缀-符串string.CW到码字流。
步骤4:先前码字PW:=当前码字CW。
步骤5:当前码字CW:=码字流的下一个码字。
步骤6:判断当前缀-符串string.CW 是否在词典中。
(1)如果”是”,则把当前缀-符串string.CW输出到字符流。
当前前缀P:=先前缀-符串string.PW。
当前字符C:=当前前缀-符串string.CW的第一个字符。
把缀-符串P+C添加到词典。
(2)如果”否”,则当前前缀P:=先前缀-符串string.PW。
当前字符C:=当前缀-符串string.CW的第一个字符。
输出缀-符串P+C到字符流,然后把它添加到词典中。
步骤7:判断码字流中是否还有码字要译。
(1)如果”是”,就返回步骤4。
(2)如果”否”,结束。
在这里插入图片描述
举例解码97, 98, 99, 257, 256, 99, 260, 100,默认dictionary为

decimalsymbol
97a
98b
99c
100d

演算如下

inoutpcis c in dic?outputdic
97nullayesa
98abno1ab:5
99bcno2BC:6
257cbno3cb:7
256bcyes
99bcano6bca:8
260abyes
100abcno5abc:9

实验步骤

1、写txt文件

在这里插入图片描述

2、设置命令参数得到输出文件out_shorten.txt

在这里插入图片描述

3、选取10种不同格式的文件进行LZW编码

编码前
在这里插入图片描述
编码后
在这里插入图片描述

总结

从编码后文件的大小来看,bmp、caj、jar、jpg格式的文件编码后没有得到压缩反而增大了数据量,造成这种情况的原因可能是文件内容重复率低,导致LWZ编码的编码压缩效率不高,甚至编码时生成了新的映射表让文件扩大了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值