一、实验目的
掌握词典编码的基本原理,用C/C++/Python等语言编程实现LZW解码器并分析编解码算法。
二、算法分析
LZW算法是通过建立一个字符串表,用较短的代码来表示较长的字符串来实现压缩。LZW算法的核心就是算法词典的建立,通过词典实现对重复字符串的压缩。
1、LZW编码
步骤1:将词典初始化为包含所有可能的单字符,当前前缀P初始化为空;
步骤2:当前字符C为字符流中的下一个字符;
步骤3:判断缀-符串 P+C是否在词典中
(1)如果“是”,P = P+C,返回步骤2
(2)如果“否”
①把代表当前前缀P的码字输出到码字流;
②把缀-符串 P+C添加到词典;
③令P=C(现在的Р仅包含一个字符C)并返回步骤2
步骤4:判断码字流中是否还有码字要译
(1)如果“是”,就返回到步骤2;
(2)如果“否”
①把代表当前前缀Р的码字输出到码字流;
②结束。
2、LZW解码
步骤1:在开始译码时词典包含所有可能的前缀根(Root)。
步骤2:CW表示码字流中的第一个码字。
步骤3:输出当前缀-符串 string.cW到码字流。
步骤4:先前码字pW : =当前码字cW;当前码字cW : =码字流中的下一个码字。
步骤5:判断当前缀-符串 string.cW是否在词典中
(1)如果“是”,则:
①把当前缀-符串string.CW输出到字符流。
②当前前缀P:=先前缀-符串 string.pW。
③当前字符C:=当前前缀-符串 string.cW的第一个字符。
④把缀-符串 P+C添加到词典。
(2)如果“否”