【数据压缩作业】LZW编解码算法实现与分析

最新推荐文章于 2022-07-03 16:26:50 发布

Abigailiar

最新推荐文章于 2022-07-03 16:26:50 发布

阅读量187

点赞数

分类专栏：数据压缩作业文章标签：数据结构

本文链接：https://blog.csdn.net/Abigailiar/article/details/115862383

版权

本文介绍LZW编码和解码原理，详细阐述了编码过程中的步骤和解码过程，包括词典初始化、码字的输出与添加、解码时的输出和词典更新。同时，通过代码实现和不同样本的压缩效率分析，展示了LZW算法在数据压缩中的应用及其对文件压缩效果的影响。实验结果表明，LZW算法适用于重复率较高的文件压缩。

摘要由CSDN通过智能技术生成

一、实验设备

安装 Windows 和 Visual Studio 等编程平台的个人计算机。

二、实验目的

掌握词典编码的基本原理，用C/C++/Python等语言编程实现LZW解码器并分析编解码算法。

三、实验原理

1.LZW编码原理

LZW的编码思想是不断地从字符流中提取新的字符串，通俗地理解为新“词条”，然后用“代号”也就是码字表示这个“词条”。这样一来，对字符流的编码就变成了用码字去替换字符流，生成码字流，从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流，字符流可以是用8位ASCII字符组成的字符串，而输出是用n位(例如12位)表示的码字流。LZW编码算法的步骤如下：

步骤1：将词典初始化为包含所有可能的单字符，当前前缀P初始化为空。

步骤2：当前字符C=字符流中的下一个字符。

步骤3：判断P＋C是否在词典中

（1）如果“是”，则用C扩展P，即让P=P＋C，返回到步骤2。

（2）如果“否”，则

输出与当前前缀P相对应的码字W；

将P＋C添加到词典中；

令P=C，并返回到步骤2。

2.LZW解码原理

LZW解码算法开始时，译码词典和编码词典相同，包含所有可能的前缀根。具体解码算法如下：

步骤1：在开始译码时词典包含所有可能的前缀根。

步骤2：令CW：=码字流中的第一个码字。

步骤3：输出当前缀-符串string.CW到码字流。

步骤4：先前码字PW：=当前码字CW。

步骤5：当前码字CW：=码字流的下一个码字。

步骤6：判断当前缀-符串string.CW 是否在词典中。

（1）如果”是”，则把当前缀-符串string.CW输出到字符流。

当前前缀P：=先前缀-符串string.PW。

当前字符C：=当前前缀-符串string.CW的第一个字符。

把缀-符串P+C添加到词典。

（2）如果”否”，则当前前缀P：=先前缀-符串string.PW。

当前字符C：=当前缀-符串string.CW的第一个字符。

输出缀-符串P+C到字符流,然后把它添加到词典中。

步骤7：判断码字流中是否还有码字要译。

（1）如果”是”，就返回步骤4。

（2）如果”否”，结束。

四、代码实现

LZW主函数代码：

/*
 * Definition for LZW coding
 *
 * vim: ts=4 sw=4 cindent nowrap
 */
#include <stdlib.h>
#include <stdio.h>
#include "bitio.h"
#pragma warning(disable:4996)  
#pragma warning(disable:4703) 
#define MAX_CODE 65535
 
struct {
   
	int suffix;
	int parent, firstchild, nextsibling;//父节点，孩子节点，兄弟姐妹结点
} dictionary[MAX_CODE + 1];
int next_code;
int d_stack[MAX_CODE]; // stack for decoding a phrase
 
#define input(f) ((int)BitsInput( f, 16))
#define output(f, x) BitsOutput( f, (unsigned long)(x), 16)
 
int DecodeString(int start, int code);
void InitDictionary(void);
void PrintDictionary(void) {
   
	int n;
	int count;
	for (n = 256; n < next_code; n++) {
   
		count = DecodeString(0, n);
		printf("%4d->", n);
		while (0 < count--) printf("%c", (char)(d_stack[count]));
		printf("\n");
	}
}
 
int DecodeString(int start