C++实现构造哈夫曼、哈夫曼编码

目录

哈夫曼树和哈夫曼编码表定义

构造哈夫曼树

select函数寻找双亲节点不为0的权重最小的2个节点

哈夫曼编码算法实现

测试代码

测试结果

 完整代码


哈夫曼树和哈夫曼编码表定义

//哈夫曼树结点类型定义
struct HTNode
{
	double weight; //结点的权值
	int parent, lch, rch; //结点的双亲,左孩子,右孩子
};

typedef HTNode* HuffmanTree; //动态分配数组存储哈夫曼树

typedef char** HuffmanCode; //动态分配数组存储哈夫曼编码表(char* cd[start])

构造哈夫曼树

//构造哈夫曼树
void CreateHuffmanTree(HuffmanTree& HT, int n)
{
	//1.初始化哈夫曼树
	if (n <= 1) //如果n<=1不在继续向下执行
	{
		return;
	}
	int m = 2 * n - 1; //数组共2n-1个元素
	HT = new HTNode[m + 1]; //0号单元未使用,HT[m]表示根结点
	//将m个元素的lch、rch、parent置为0
	for (int i = 1; i <= m; i++)
	{
		HT[i].parent = 0;
		HT[i].lch = 0;
		HT[i].rch = 0;
	}
	//输入前n个元素的weigth值
	for (int i = 1; i <= n; i++)
	{
		cout << "请输入第" << i << "个元素的权值:" << endl;
		cin >> HT[i].weight;
	}

	//2.初始化结束,构建哈夫曼树
	for (int i = n + 1; i <= m; i++) //合并产生n-1个结点
	{
		//在HT[k](1<=k<=i-1)中选择两个其双亲域为0
		//且权值最小的结点,并返回它们在HT中的序号s1和s2
		int s1 = 0, s2 = 0;
		Selete(HT, i - 1, s1, s2);

		HT[s1].parent = i; //s1、s2的双亲为i
		HT[s2].parent = i;
		HT[i].lch = s1; //s1、s2分别作为i的左右孩子
		HT[i].rch = s2;
		HT[i].weight = HT[s1].weight + HT[s2].weight; //i的权值为左右孩子权值的和
	}

}

select函数寻找双亲节点不为0的权重最小的2个节点

//在HT[k](1<=k<=i-1)中选择两个其双亲域为0,且权值最小的结点,并返回它们在HT中的序号s1和s2
void Selete(HuffmanTree HT, int i, int &s1, int &s2)
{
	double min = INT_MAX; //INT_MAX是一个很大的数,要使用头文件limits
	for (int j = 1; j <= i; j++)
	{
		//如果第j个元素的weight值小于min,且第j个元素的双亲值为0
		//则将该值赋给min,j赋值给是s1
		if ( min > HT[j].weight && HT[j].parent == 0)
		{
			min = HT[j].weight;
			s1 = j;
		}
	}

	min = INT_MAX; //重新给min赋值
	for (int j = 1; j <= i; j++)
	{
		//如果第j个元素的weight值小于min,且j不等于s1,且第j个元素的双亲值为0
		//则将该值赋给min,j赋值给是s2
		if (min > HT[j].weight && j != s1 && HT[j].parent == 0)
		{
			min = HT[j].weight;
			s2 = j;
		}
	}
}

哈夫曼编码算法实现

//哈夫曼编码
void CreateHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n)
{
	HC = new char* [n + 1];//分配n个字符编码的头指针矢量,从1号位置开始,0号位置不使用
	char* cd = new char[n];//分配临时存放编码的动态数组空间
	cd[n - 1] = '\0'; //数组末尾存放结束符

	for (int i = 1; i <= n; i++) //逐个字符求哈夫曼编码
	{
		int start = n - 1;//start开始时指向最后,即编码结束符的位置
		int c = i;//c用于记录从叶子结点向上回溯至根结点所经过的结点下标
		int f = HT[i].parent;//f指向结点c的双亲结点
		while (f != 0)//从叶子结点开始向上回溯,直到根结点
		{
			--start;//回溯一次,start向前一个位置
			if (HT[f].lch == c)
			{
				cd[start] = '0'; //结点c时f的左孩子,则生成代码0
			}
			else
			{
				cd[start] = '1'; //结点c时f的右孩子,则生成代码1
			}
			//继续向上回溯
			c = f;
			f = HT[f].parent;
		}
		HC[i] = new char[n - start];//为第i个字符编码分配空间
		strcpy(HC[i], &cd[start]);//将求得的编码从临时空间cd复制到HC的当前行中
	}
	delete[] cd;//释放零时空间
}

测试代码

int main()
{
	//例:设n=7,w={0.4,0.3,0.15,0.05,0.04,0.03,0.03}构造哈夫曼树
	HuffmanTree HT;
	int n = 7; 
	CreateHuffmanTree(HT, n);
	//输出
	cout << "下标" << "\t" << "weight" << "\t" << "parent"
		<< "\t" << "lch" << "\t" << "rch" << endl;
	for (int i = 1; i <= 2 * n - 1; i++)
	{
		cout << i << "\t" << HT[i].weight << "\t" << HT[i].parent
			<< "\t" << HT[i].lch << "\t" << HT[i].rch << endl;
	}
	cout << endl;

	//设计Huffman code(哈夫曼编码)
	HuffmanCode HC;
	CreateHuffmanCode(HT, HC, n);
	for (int i = 1; i <= n; i++)
	{
		cout << "第" << i << "个字符的编码为:" << HC[i] << endl;
	}
	
	system("pause");
	return 0;
}

测试结果

例:设n=7,w={0.4,0.3,0.15,0.05,0.04,0.03,0.03}构造哈夫曼树,并求哈夫曼编码

 完整代码

#define _CRT_SECURE_NO_WARNINGS //VS使用strcopy函数要加这个常量
#include<iostream>
using namespace std;
#include<limits>

//哈夫曼树结点类型定义
struct HTNode
{
	double weight; //结点的权值
	int parent, lch, rch; //结点的双亲,左孩子,右孩子
};

typedef HTNode* HuffmanTree; //动态分配数组存储哈夫曼树

typedef char** HuffmanCode; //动态分配数组存储哈夫曼编码表(char* cd[start])

//声明
void Selete(HuffmanTree HT, int i, int& s1, int& s2);

//构造哈夫曼树
void CreateHuffmanTree(HuffmanTree& HT, int n)
{
	//1.初始化哈夫曼树
	if (n <= 1) //如果n<=1不在继续向下执行
	{
		return;
	}
	int m = 2 * n - 1; //数组共2n-1个元素
	HT = new HTNode[m + 1]; //0号单元未使用,HT[m]表示根结点
	//将m个元素的lch、rch、parent置为0
	for (int i = 1; i <= m; i++)
	{
		HT[i].parent = 0;
		HT[i].lch = 0;
		HT[i].rch = 0;
	}
	//输入前n个元素的weigth值
	for (int i = 1; i <= n; i++)
	{
		cout << "请输入第" << i << "个元素的权值:" << endl;
		cin >> HT[i].weight;
	}

	//2.初始化结束,构建哈夫曼树
	for (int i = n + 1; i <= m; i++) //合并产生n-1个结点
	{
		//在HT[k](1<=k<=i-1)中选择两个其双亲域为0
		//且权值最小的结点,并返回它们在HT中的序号s1和s2
		int s1 = 0, s2 = 0;
		Selete(HT, i - 1, s1, s2);

		HT[s1].parent = i; //s1、s2的双亲为i
		HT[s2].parent = i;
		HT[i].lch = s1; //s1、s2分别作为i的左右孩子
		HT[i].rch = s2;
		HT[i].weight = HT[s1].weight + HT[s2].weight; //i的权值为左右孩子权值的和
	}

}

//在HT[k](1<=k<=i-1)中选择两个其双亲域为0,且权值最小的结点,并返回它们在HT中的序号s1和s2
void Selete(HuffmanTree HT, int i, int &s1, int &s2)
{
	double min = INT_MAX; //INT_MAX是一个很大的数,要使用头文件limits
	for (int j = 1; j <= i; j++)
	{
		//如果第j个元素的weight值小于min,且第j个元素的双亲值为0
		//则将该值赋给min,j赋值给是s1
		if ( min > HT[j].weight && HT[j].parent == 0)
		{
			min = HT[j].weight;
			s1 = j;
		}
	}

	min = INT_MAX; //重新给min赋值
	for (int j = 1; j <= i; j++)
	{
		//如果第j个元素的weight值小于min,且j不等于s1,且第j个元素的双亲值为0
		//则将该值赋给min,j赋值给是s2
		if (min > HT[j].weight && j != s1 && HT[j].parent == 0)
		{
			min = HT[j].weight;
			s2 = j;
		}
	}
}

//哈夫曼编码
void CreateHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n)
{
	HC = new char* [n + 1];//分配n个字符编码的头指针矢量,从1号位置开始,0号位置不使用
	char* cd = new char[n];//分配临时存放编码的动态数组空间
	cd[n - 1] = '\0'; //数组末尾存放结束符

	for (int i = 1; i <= n; i++) //逐个字符求哈夫曼编码
	{
		int start = n - 1;//start开始时指向最后,即编码结束符的位置
		int c = i;//c用于记录从叶子结点向上回溯至根结点所经过的结点下标
		int f = HT[i].parent;//f指向结点c的双亲结点
		while (f != 0)//从叶子结点开始向上回溯,直到根结点
		{
			--start;//回溯一次,start向前一个位置
			if (HT[f].lch == c)
			{
				cd[start] = '0'; //结点c时f的左孩子,则生成代码0
			}
			else
			{
				cd[start] = '1'; //结点c时f的右孩子,则生成代码1
			}
			//继续向上回溯
			c = f;
			f = HT[f].parent;
		}
		HC[i] = new char[n - start];//为第i个字符编码分配空间
		strcpy(HC[i], &cd[start]);//将求得的编码从临时空间cd复制到HC的当前行中
	}
	delete[] cd;//释放零时空间
}

int main()
{
	//例:设n=7,w={0.4,0.3,0.15,0.05,0.04,0.03,0.03}构造哈夫曼树
	HuffmanTree HT;
	int n = 7; 
	CreateHuffmanTree(HT, n);
	//输出
	cout << "下标" << "\t" << "weight" << "\t" << "parent"
		<< "\t" << "lch" << "\t" << "rch" << endl;
	for (int i = 1; i <= 2 * n - 1; i++)
	{
		cout << i << "\t" << HT[i].weight << "\t" << HT[i].parent
			<< "\t" << HT[i].lch << "\t" << HT[i].rch << endl;
	}
	cout << endl;

	//设计Huffman code(哈夫曼编码)
	HuffmanCode HC;
	CreateHuffmanCode(HT, HC, n);
	for (int i = 1; i <= n; i++)
	{
		cout << "第" << i << "个字符的编码为:" << HC[i] << endl;
	}
	
	system("pause");
	return 0;
}

  • 5
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 哈夫曼树是一种特殊的二叉树,用于实现哈夫曼编码哈夫曼编码是一种无损压缩数据的方式,可以将一个字符串或者文件转换为一个“01”序列,使其占用的空间更小。 构造哈夫曼树的过程首先需要计算每个字符出现的频率,然后将这些字符和频率建立起来一个数组。接着,以这个数组为基础构造哈夫曼树。具体的步骤是: 1. 将字符和频率存储在一个数组中。 2. 根据频率从小到大排序数组。 3. 取出数组中的前两个元素,将其权值相加生成一个新的节点,将这个节点放回数组中。 4. 重复第三步,直到只剩下一个节点。 5. 最后构造出来的即为哈夫曼树。 接着,就可以根据哈夫曼树实现哈夫曼编码了。哈夫曼编码规则是:在哈夫曼树中,从根节点到该字符所在叶子节点的路径中,若经过的左子树则输出0,经过的右子树则输出1。例如,对于字符串"hello",哈夫曼编码为: h: 110, e: 111, l: 01, o: 00。 总之,哈夫曼树哈夫曼编码是无损压缩算法中的经典算法,在各种压缩领域都有广泛应用。 ### 回答2: 哈夫曼树是一种树型数据结构,可以用来进行数据的压缩和解压缩。构造哈夫曼树算法通常采用贪心策略,即在每一步中选择权值最小的两个节点,并将它们合并成一个新的节点,直到形成一个根节点为止。 在构造哈夫曼树后,可以通过遍历树来获取每个字符的编码。具体来说,可以从根节点开始遍历,遇到左子树则在编码末尾添加0,遇到右子树则在编码末尾添加1,直到达到叶子节点,即可得到该字符的哈夫曼编码哈夫曼编码的主要优势在于其具有变长编码,即不同字符的编码长度可以不同。这比固定长度编码更加高效,因为在压缩稀疏数据时,短编码可以显著减少编码长度。 下面我们来实现哈夫曼编码的具体代码,以字符串"hello world"为例: 1.首先需要统计每个字符出现的次数,并按照出现次数从小到大排序,以便构造哈夫曼树。 ``` from collections import Counter string = "hello world" counter = dict(Counter(string)) sorted_count = sorted(counter.items(), key=lambda x: x[1]) ``` 2.使用sorted_count中的数据构造哈夫曼树。 ``` class Node(object): def __init__(self, value, freq): self.value = value self.freq = freq self.left = None self.right = None def build_huffman_tree(sorted_count): nodes = [Node(value=c[0], freq=c[1]) for c in sorted_count] while len(nodes) > 1: node1 = nodes.pop(0) node2 = nodes.pop(0) new_node = Node(value="", freq=node1.freq + node2.freq) new_node.left = node1 new_node.right = node2 nodes.append(new_node) nodes = sorted(nodes, key=lambda x: x.freq) root = nodes[0] return root root = build_huffman_tree(sorted_count) ``` 3.遍历哈夫曼树,获取每个字符的编码。 ``` def traverse_tree(node, code, codes): if node is None: return if node.value: codes[node.value] = code return traverse_tree(node.left, code + "0", codes) traverse_tree(node.right, code + "1", codes) codes = {} traverse_tree(root, "", codes) print(codes) ``` 输出结果为: ``` {'h': '1110', 'w': '11000', 'r': '11001', 'd': '11010', 'e': '001', ' ': '010', 'l': '000', 'o': '1111'} ``` 这就是"hello world"字符串中每个字符的哈夫曼编码。使用这些编码可以非常高效地将原始数据进行压缩。 ### 回答3: 哈夫曼树是一种经典的树形结构,可以用来实现哈夫曼编码哈夫曼编码是一种基于变长编码的数据压缩算法,它利用出现频率较高的字符来用较短的编码来表示,从而实现对数据的压缩。 哈夫曼树构造方法是:首先将所有的字符按照出现频率从小到大排序,然后将出现频率最小的两个字符合并成一棵二叉树,其权值为两个字符的权值之和。然后将合并后的二叉树插入到原来的序列中,重新排序。然后再将出现频率最小的两个字符合并成一棵二叉树,以此类推,直到构造出一棵包含所有字符的二叉树,这就是哈夫曼树哈夫曼编码实现方法是:对于哈夫曼树上的每一个叶子节点,将其路径上的左右分支分别标记为0和1,得到该叶子节点对应的编码。然后将每个字符对应的编码存储起来,即可得到该字符串的哈夫曼编码哈夫曼编码具有很好的压缩效果,因为它可以使得出现频率较高的字符用较短的编码表示,从而减小了编码的总长度,实现了对数据的压缩。同时,哈夫曼编码还具有唯一解的性质,即每个字符都有唯一的编码,从而避免解压缩时出现歧义。因此,哈夫曼编码在数据压缩领域得到了广泛的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值