哈弗曼树及哈夫曼编码_哈弗曼树哈夫曼编码-CSDN博客

本文链接：https://blog.csdn.net/MH3709/article/details/116331537

最近在数据结构课上学习了哈夫曼树及编码，当时听完之后觉得这也不难啊，不就是利用贪心的思想构造了带权路径和最短的树而已，后来去做老师布置的作业之后发现真是写不出来，不知从哪下手。看了慕课上陈越老师讲的之后，发现在每次寻找权值最小的子树合并时用到了堆的概念。堆其实就是优先队列，是一个根节点最小或最大的完全二叉树，每次可以拿出最小的，陈越老师讲解了堆的伪代码。看完视频之后，我感觉更不知道咋写了，赶紧去网上找找大佬写的自己学学压压惊。

首先是哈夫曼树的构造，由于哈弗曼树满足带权路径和最短，所以权值小的先构造，权值大的后构造。这样权值大的路径小，用贪心的概念看就是最小的（因为满足最优子结构性质和贪心选择性质证明看《算法导论》234页）。
编码就是满足左子树为0，右子树为1，这样不会存在一个字母的编码是另一个字母的前缀。这时候要问了，这是为啥？因为哈夫曼编码是字母是在叶子节点上，那么从根节点到该叶子节点上不可能存在其他字母（^^要不然他就不是叶子节点了），那么我们不难想出来，n个字母构造的哈弗曼树是2n-1个节点。

在这里插入图片描述
准备工作完成了，那就上代码把

#include<iostream>
#include<queue>
#include<string>
using namespace std;
struct Tree {
	int weight;
	char name;
	Tree *Left, *Right;
};
string code[22];//记录编码结果
int ans;
string s = "abcdefghijklmnopqrstvwxyz";//方便输出结果
struct cmp {
	bool operator()(const Tree T1, const Tree T2) {
		return T1.weight >= T2.weight;
	}
};
priority_queue<Tree, vector<Tree>, cmp> q;
string Code;
void dfs(Tree *t) {
	if (!t->Left && !t->Right)
	{
		code[t->name - 'a'] = Code;
		return;
	}
	Code.push_back('0');
	dfs(t->Left);
	Code.pop_back();

	Code.push_back('1');
	dfs(t->Right);
	Code.pop_back();
}
int main() {
	int n, W[22];
	string str;
	cin >> n >> str;
	for (int i = 0; i < n; i++) {
		cin >> W[i], q.push({ W[i],str[i],NULL,NULL });
	}
	Tree *L, *R, *T;
	Tree a, b;
	while (!q.empty()) {
		a = q.top(), q.pop();
		L = new Tree();
		L->weight = a.weight, L->name = a.name;
		L->Left = a.Left, L->Right = a.Right;
		if (!q.empty()) {
			b = q.top(), q.pop();
			R = new Tree();
			R->weight = b.weight, R->name = b.name;
			R->Left = b.Left, R->Right = b.Right;
		}
		else
			break;
		ans = ans + a.weight + b.weight;
		q.push({ a.weight + b.weight, '-', L, R });
	}
	T = L;
	dfs(T);
	cout <<ans << endl;
	for (int i = 0; i < n; i++) {
		cout << s[i] << ':' << code[i] << endl;
	}
	return 0;
}