数据结构&&课程设计&&哈夫曼编译码器-课程设计报告

爱小黄

已于 2022-11-05 22:47:44 修改

阅读量2.5k

点赞数 4

分类专栏：数据结构文章标签：数据结构

于 2019-12-24 16:22:45 首次发布

本文链接：https://blog.csdn.net/weixin_44110581/article/details/103685016

版权

数据结构专栏收录该内容

5 篇文章 0 订阅

订阅专栏

哈夫曼编译码器

点击获取课程设计报告

需求分析

1. 哈夫曼编译码器的功能是：

1.1 初始化

从文件“ HuffmanCode.txt ” 读入字符集大小n，以及n个字符和n个权值，建立哈夫曼树，并构建哈夫曼编码表。

1.2 编码

利用已建好的哈夫曼树，对文件“ 明文.txt ”中的正文进行编码，然后将结果存入文件“ HuffmanEnCode.txt ”中。

1.3 译码

利用已建好的哈夫曼树将文件“ 密文.txt ” 中的代码进行译码，结果存入文件“ HuffmanDeCode.txt ”中。

1.4 输入哈夫曼编码表

将哈夫曼编码表打印到屏幕上。

2. 设计思路

用结构体数组存储哈夫曼树，用字符串数组存储哈夫曼编码表。

3. 设计思路分析

将所有单元中的双亲、左孩子、右孩子的下标都初始化为0，再输入n个单元中叶子结点的字符、权值。通过n-1次的选择、删除与合并来创建哈夫曼树。选择功能另有函数说明，删除即将结点s1 和 s2 的双亲改为其下标值；合并即将s1 和 s2 的权值和作为一个新的权值依次存入到数组的第n+1 之后的单元中，同时记录这个新结点左孩子的下标为s1 ，右孩子的下标为s2。

(1)编码

有了字符集的哈夫曼编码表之后，对数据文件的编码过程是:依次读人文件中的字符c.在哈夫曼编码表HC中找到此字符，将字符C转换为编码表中存放的编码串。

(2)译码

对编码后的文件进行译码的过程必须借助于哈夫曼树。具体过程是:依次读人文件的二进制码，从哈夫曼树的根结点(即HT[m])出发，若当前读人0,则走向左孩子，否则走向右孩子。且到达某-叶子HT[]时便译出相应的字符编码HC[]。然后重新从根出发继续译码，直至文件结束。

4. 测试数据：

1、abcdefg编码-> 01101111111111101100000011110101010111100000
2、aebdcdfd编码->011011111101011111000001111011000000110101000001
3、01101111111111101100000011110101010111100000译码->abcdefg
4、0110011110001001101111110000101000110110111011000->Huantao

概要设计（源代码）

1、元素类型、结点类型和指针类型：

typedef struct {
	char c;
	int weight; 
	int parent, lchild, rchild;
}HTNode, * HuffmanTree; 
typedef char ** HuffmanCode;//动态分配数组储存的哈夫曼编码表

2、创建哈夫曼树：

int CreateHuffmanTree(HuffmanTree& HT, int &n) {
	int root;//记录数根
	int s1=0, s2=0;
	//初始化
	int m;//总结点数
	m = 2 * n - 1;
	HT = new HTNode[m + 1];
	infile(HT, n);
	for (int i = 1; i <= m; ++i) {
		HT[i].parent = 0;
		HT[i].lchild = 0;
		HT[i].rchild = 0;
	}
	//创建哈夫曼树
	for (int i = n + 1; i <= m; ++i)
	{
		Select(HT, i - 1, s1, s2);
		HT[s1].parent = i; HT[s2].parent = i;
		HT[i].lchild = s1;
		HT[i].rchild = s2;
		HT[i].weight = HT[s1].weight + HT[s2].weight;
	}
	m = 2 * n - 1;
	return m;
}

3、Select（）选择权值最小的结点

void Select(HuffmanTree HT, int n,int &s1,int &s2) {
	//cout << "select() is working";
	//cout << n << endl;
	int min = 4000l;
	for (int i = 1; i <=n; ++i) {
	if(min>	HT[i].weight&&HT[i].parent==0){//双亲为零
			s1= i;
		min = HT[i].weight;
	}
	}
	min = 4000l;
	for (int i = 1; i <=n; ++i) {
		if (min > HT[i].weight&& i != s1&&HT[i].parent == 0) {
			s2 = i;
			min = HT[i].weight;
		}
	}
}

4、创建哈夫曼编码表

void CreatHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n) {

	HC = new char * [n + 1];//分配储存n个字符编码的编码表空间
	//cd的类型是什么
	char* cd = new char[n];//分配临时存放每个字符编码的动态数组空间
	cd[n - 1] = '\0';//编码结束符
	int start;//记录编码在cd中存放的位置
	int f;//记录i的双亲结点的下标
	int c;//记录从叶子结点向上回溯至根结点所经过的结点下标，
	for (int i = 1; i <= n; ++i) {//逐个字符求哈夫曼编码
		//cout << "第" << i << "个开始回溯" << endl;
		start = n - 1;//start开始时指向最后，即编码结束符的位置
		c = i;//当前待编码字符的下标
		f = HT[i].parent;
		while (f != 0) {//从叶子结点开始回溯，直到根结点结束
			--start;
			if (HT[f].lchild == c) cd[start] = '0';//左结点，生成0
			else cd[start] = '1';//右节点，生成1
			c = f;
			f = HT[f].parent;//继续向上回溯
		}
		HC[i] = new char[n - start];
		strcpy_s(HC[i], strlen(&cd[start])+1, &cd[start]);//将求得的编码从临时空间cd复制到HC的当前行中
	}
	delete []cd;//释放临时空间
}

5、编码功能实现EnCode（）：

void EnCode(HuffmanTree HT,HuffmanCode HC,int n) {
	char c;
	int i=0;
	//在HC中找到此字符，将字符c转换为编码表中存放的编码串。
		//读取明文文件
		//1.建立文件对象
		fstream infile;
		fstream ofile;
		//2.打开文件
		infile.open("明文.txt", ios::in);
		if (!infile)
		{
			cout << "明文文件打开失败！！" << endl;
			exit(0);
		}
		ofile.open("HuffmanEnCode.txt");
		if (!ofile)
		{
			cout << "目标文件打开失败！！" << endl;
			exit(0);
		}
		//3.读文件
		int k;
		while (infile >> c) {
			k = locate(HT,n,c);
			cout << HC[k]<<endl;
			ofile << HC[k];
			++i;
		}
		if (i == 0)
			cout << "文件为空，请添加内容！" << endl;

		//4.关闭文件
		infile.close();
		ofile.close();
}

6、译码功能实现：

void HuffmanDecode(HuffmanTree HT, int n) {
	char decode[100];
	int i=1, len=0, p=0;
	fstream infile,ofile;

	//2.打开文件
	infile.open("密文.txt", ios::in);
	ofile.open("HuffmanDeCode.txt",ios::out);
	if (!infile||!ofile)
	{
		cout << "文件打开失败！！" << endl;
		exit(0);
	}
	//3.读文件
	int k;
	p = 2 * n - 1;
	while (infile >> decode[i]) {
		i++;
	}
	len = i-1;//长度减一
	if (i == 0)
		cout << "文件为空，请添加内容！" << endl;
	//4.关闭文件
	infile.close();
	for (i = 1; i <= len+1; i++) {//注意边界值
		if (HT[p].lchild == 0 && HT[p].rchild == 0) {
			cout << HT[p].c;
			ofile << HT[p].c;
			p = 2 * n - 1;
		}
		if (decode[i] == '0')
			p = HT[p].lchild;
		else if (decode[i] == '1')
			p = HT[p].rchild;
	}
}

7、主函数和其他函数：

int main() {
	int n=0;
	int m=0;//记录哈夫曼树根
	HuffmanTree HT;
	HuffmanCode HC;
	n = infile_n();
	CreateHuffmanTree(HT,n);
	CreatHuffmanCode(HT, HC, n);
	menu(HT, HC,n);
	return 0;
}
主菜单函数：
void menu(HuffmanTree &HT, HuffmanCode &HC, int n) {
	int choice = 1;
	cout << "  使用说明:"<<endl;
	cout << "  文件：“HumanCode.txt中”字符及其权重。" << endl;
	cout << "  文件：“明文.txt中”存放待编码的字符。"<<endl<<"  文件：“HuffmanEnCode.txt”为存放哈夫曼编码的目标文件"<<endl;
	cout << "  文件：“密文.txt”  存放待译码的字符。" << endl << "  文件：“HuffmanEnCode.txt”为存放哈夫曼编码的目标文件" << endl;
	while (1)
	{
		cout << "**************主菜单**************" << endl;
		cout << "           1.译码" << endl;
		cout << "           2.编码" << endl;
		cout << "           3.哈夫曼编码表" << endl;
		cout << "           0.退出" << endl;
		cout << "**********************************" << endl;
		cout << "请输入所要操作的编号：";
		cin >> choice;
		switch (choice)
		{
		case 1:
			cout << "哈夫曼译码结果" << endl;
			HuffmanDecode(HT, n);
			cout << endl;
			break;
		case 2:
			cout << "哈夫曼编码结果" << endl;
			EnCode(HT, HC, n);
			cout << endl;
			break;
		case 3:
			ShowHuffmanCode(HT,HC, n);
			cout << endl;
			break;
			// case 4: ;break;
		case 0: cout << "谢谢您的使用！" << endl; exit(0); break;
		default:cout << "请输入0~4之间的数字！" << endl; break;
		}
	}
}
显示编码表函数：
void ShowHuffmanCode(HuffmanTree HT,HuffmanCode HC,int n) {
	for (int i = 1; i <= n; ++i) {
		cout << HT[i].c<< "编码为";
		cout << HC[i] << endl;
	}
}

5. 调用关系图

在这里插入图片描述

end！！！

心得体会

通过这次课程设计，我熟悉许多概念并提高了用所学的知识来解决问题的能力。
哈夫曼树又称最优树，是一类带权路径长度最短的树，在实际中有广泛的用途。

总结

哈夫曼树概念的定义
(1)路径:从树中一个结点到另个结点之间的分支构成这两个结点之间的路径。
(2)路径长度:路径上的分支数目称作路径长度。
(3)树的路径长度:从树根到每结点的路径长度之和。
(4)权:赋予某个实体的一个量，是对实体的某个或某些属性的数值化描述。在数据结构中，实体有结点和边两大类，所以对应有结点权和边权。
(5)结点的带权路径长度:从该结点到树根之间的路径长度与结点上权的乘积。
(6)树的带权路径长度:树中所有叶子结点的带权路径长度之和，通常记作WPL
(7)哈夫曼树:假设有m个权值，可以构造一棵含n个叶子结点的二又怀。每个叶子结点的权为w.则其中带权路径长度WP最小的二叉树称做最优二又树或哈夫曼树

哈夫曼树的构造算法过程：

(1)根据给定的n个权值{w1，w.. }，构造n棵只有根结点的二叉树这n棵二又树构成一个森林F。1
(2)在森林F中选取两棵根结点的权值最小的树作为左右子树构造 棵新的二叉树，目置新的二叉树的根结点的权值为其左、右子树上根结点的权值之和。
(3)在森林F中删除这两棵树，同时将新得到的二叉树加人F中。
(4)重复(2)和(3).直到F只含-棵树为止。这棵树便是哈夫曼树。