重庆邮电大学数据结构实验四

实验四 基于哈夫曼树的数据压缩算法
一、实验目的
1. 掌握哈夫曼树的构造算法。
2. 掌握哈夫曼编码的构造算法。
二、实验内容
问题描述
输入一串字符串,根据给定的字符串中字符出现的频率建立相应的哈夫曼树,
构造哈夫曼编码表,在此基础上可以对压缩文件进行压缩 ( 即编码 ) ,同时可以对
压缩后的二进制编码文件进行解压 ( 即译码 )
输入要求
多组数据,每组数据 1 行,为一个字符串 ( 只考虑 26 个小写字母即可 ) 。当
输入字符串为 “0” 时,输入结束
输出要求
每组数据输出 2n+3 (n 为输入串中字符类别的个数 ) 。第 1 行为统计出来
的字符出现频率 ( 只输出存在的字符,格式为 : 字符 : 频度 ) ,每两组字符之间用一
个空格分隔,字符按照 ASCI 码从小到大的顺序排列。第 2 行至第 2n 行为哈夫
曼树的存储结构的终态 ( 如主教材 139 页表 5.2( b), 一行当中的数据用空格分
) 。第 2n+1 行为每个字符的哈夫曼编码 ( 只输出存在的字符。格式为 : 字符 : 编码 )
每两组字符之间用一个空格分隔,字符按照 ASCI 码从小到大的顺序排列。第
2n+2 行为编码后的字符串,第 2n+3 行为解码后的字符串 ( 与输入的字符串相同 )
输入样例
aaaaaaabbbbbccdddd
aabccc
0
输出样例
a:7 b:5 c:2 d:4
1 7 7 0 0
2 5 6 0 0
3 2 5 0 0
4 4 5 0 0
5 6 6 3 4
6 11 7 2 5
7 18 0 1 6
a:0 b:10 c:110 d:111
00000001010101010110110111111111111
aaaaaabbbbbccdddd
a:2 b:1 c:3
1 2 4 0 0
2 1 4 0 0
3 3 5 0 0
4 3 5 2 1
5 6 0 3 4
a:11 b:10 c:0
111110000
aabccc
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <string>
#include <cstring>
#include <cmath>
using namespace std;
int num;
int alpha[26];
int num2 = 0;
int k = 0;
char list[26];

typedef struct {
	int weight;        //结点的权值 
	int parent, lchild, rchild;
}HTNode, * HuffmanTree; //哈夫曼编码表 

typedef char** HuffmanCode;

void Select(HuffmanTree HT, int sum, int& s1, int& s2)
{
	int i, min1 = 100, min2 = 100;
	for (i = 1; i <= sum; i++)
	{
		if (HT[i].parent == 0 && HT[i].weight < min1)
		{
			min1 = HT[i].weight;
			s1 = i;
		}
	}
	int temp = HT[s1].weight;     //将原值存放起来,然后先赋予最大值,防止s1被重复选择
	HT[s1].weight = 100;
	for (i = 1; i <= sum; i++)
	{
		if (HT[i].parent == 0 && HT[i].weight < min2)
		{
			min2 = HT[i].weight;
			s2 = i;
		}
	}
	HT[s1].weight = temp;
}

void CreateHuffmanTree(HuffmanTree& HT, int n)
{
	int i;
	if (n <= 1) return;
	int m = 2 * n - 1;
	HT = new HTNode[m + 1];
	for (i = 1; i <= m; i++)
	{
		HT[i].parent = 0; HT[i].lchild = 0; HT[i].rchild = 0;
	}
	for (i = 1; i <= n; i++) //输入叶子结点的权值 
		HT[i].weight = alpha[i - 1];
	int s1, s2;
	for (i = n + 1; i <= m; i++)
	{
		Select(HT, i - 1, s1, s2);
		HT[s1].parent = i;
		HT[s2].parent = i;
		HT[i].lchild = s1;
		HT[i].rchild = s2;
		HT[i].weight = HT[s1].weight + HT[s2].weight;
	}
}

void CreatHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n)
{ //从叶子到根逆向求每个字符的赫夫曼编码,存储在编码表HC中
	int i, start, c, f;
	HC = new char* [n + 1];         						//分配n个字符编码的编码表空间 
	char* cd = new char[n];							//分配临时存放编码的动态数组空间
	cd[n - 1] = '\0';                            		//编码结束符
	for (i = 1; i <= n; ++i)                               //逐个字符求赫夫曼编码
	{
		start = n - 1;                          		//start开始时指向最后,即编码结束符位置
		c = i;
		f = HT[i].parent;                 			//f指向结点c的双亲结点
		while (f != 0)
		{                          					//从叶子结点开始向上回溯,直到根结点
			--start;                          		//回溯一次start向前指一个位置
			if (HT[f].lchild == c)
				cd[start] = '0';						//结点c是f的左孩子,则生成代码0
			else
				cd[start] = '1';                 		//结点c是f的右孩子,则生成代码1
			c = f;
			f = HT[f].parent;             			//继续向上回溯
		}                                  			//求出第i个字符的编码      
		HC[i] = new char[n - start];         			// 为第i 个字符编码分配空间
		strcpy(HC[i], &cd[start]);        			//将求得的编码从临时空间cd复制到HC的当前行中
	}
	delete cd;                            			//释放临时空间
}													// CreatHuffanCode
void Output(HuffmanTree HT, HuffmanCode HC)
{
	for (int i = 1; i <= 2 * k - 1; i++)
		cout << i << " " << HT[i].weight << " " << HT[i].parent << " " << HT[i].lchild << " " << HT[i].rchild << endl;

	for (int i = 1; i <= k; i++)
	{
		cout << list[i - 1] << ":" << HC[i];
		if (i != k)cout << " ";//多输出了一个 
	}
	cout << endl;
}


void Initalpha(int a[], string s)
{
	int i = 0;
	while (s[i] != '\0')
	{
		int e = (int)s[i];
		if (e >= 97) a[e - 97]++;
		i++;
	}
	for (i = 0; i < 26; i++)
		if (a[i]) {
			num++;
		}
	for (i = 0; i < 26; i++)
		if (a[i]) {
			char e = (char)(i + 97);
			cout << e << ":" << a[i];
			if (k != num - 1)cout << " ";//多输出了一个 
			alpha[k] = a[i];
			list[k] = e;
			k++;
		}
	cout << endl;
}


void InitData(int fre[])
{

	for (int i = 0; i < 26; i++)
		fre[i] = 0;
	for (int i = 0; i < 26; i++)
		list[i] = 0;
	k = 0; num2 = 0, num = 0;
	return;
}
void Translate(HuffmanCode HC, string s)
{
	int i = 0;
	while (s[i]) {
		int j = 0;
		while (j < 26)
		{
			if (s[i] == list[j])//如果该字符与namelist中某个字符相等
				cout << HC[j + 1];//输出其对应编码 
			j++;
		}
		i++;
	}
	cout << endl;

	i = 0;
	while (s[i]) {
		char e;
		e = s[i];
		cout << e;
		i++;
	}
	cout << endl;
}

int main()
{
	string s;
	while (cin >> s && s != "0")
	{

		InitData(alpha);
		Initalpha(alpha, s);
		HuffmanTree HT;
		HuffmanCode HC;
		CreateHuffmanTree(HT, k);
		CreatHuffmanCode(HT, HC, k);
		Output(HT, HC);
		Translate(HC, s);
	}
	return 0;

}

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼树(Tree printing)。将已在内存中的哈夫曼树以直观的方式(比如树)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值