最近在数据结构课上学习了哈夫曼树及编码,当时听完之后觉得这也不难啊,不就是利用贪心的思想构造了带权路径和最短的树而已,后来去做老师布置的作业之后发现真是写不出来,不知从哪下手。看了慕课上陈越老师讲的之后,发现在每次寻找权值最小的子树合并时用到了堆的概念。堆其实就是优先队列,是一个根节点最小或最大的完全二叉树,每次可以拿出最小的,陈越老师讲解了堆的伪代码。看完视频之后,我感觉更不知道咋写了,赶紧去网上找找大佬写的自己学学压压惊。
首先是哈夫曼树的构造,由于哈弗曼树满足带权路径和最短,所以权值小的先构造,权值大的后构造。这样权值大的路径小,用贪心的概念看就是最小的(因为满足最优子结构性质和贪心选择性质证明看《算法导论》234页)。
编码就是满足左子树为0,右子树为1,这样不会存在一个字母的编码是另一个字母的前缀。这时候要问了,这是为啥?因为哈夫曼编码是字母是在叶子节点上,那么从根节点到该叶子节点上不可能存在其他字母(^^要不然他就不是叶子节点了),那么我们不难想出来,n个字母构造的哈弗曼树是2n-1个节点。
准备工作完成了,那就上代码把
#include<iostream>
#include<queue>
#include<string>
using namespace std;
struct Tree {
int weight;
char name;
Tree *Left, *Right;
};
string code[22];//记录编码结果
int ans;
string s = "abcdefghijklmnopqrstvwxyz";//方便输出结果
struct cmp {
bool operator()(const Tree T1, const Tree T2) {
return T1.weight >= T2.weight;
}
};
priority_queue<Tree, vector<Tree>, cmp> q;
string Code;
void dfs(Tree *t) {
if (!t->Left && !t->Right)
{
code[t->name - 'a'] = Code;
return;
}
Code.push_back('0');
dfs(t->Left);
Code.pop_back();
Code.push_back('1');
dfs(t->Right);
Code.pop_back();
}
int main() {
int n, W[22];
string str;
cin >> n >> str;
for (int i = 0; i < n; i++) {
cin >> W[i], q.push({ W[i],str[i],NULL,NULL });
}
Tree *L, *R, *T;
Tree a, b;
while (!q.empty()) {
a = q.top(), q.pop();
L = new Tree();
L->weight = a.weight, L->name = a.name;
L->Left = a.Left, L->Right = a.Right;
if (!q.empty()) {
b = q.top(), q.pop();
R = new Tree();
R->weight = b.weight, R->name = b.name;
R->Left = b.Left, R->Right = b.Right;
}
else
break;
ans = ans + a.weight + b.weight;
q.push({ a.weight + b.weight, '-', L, R });
}
T = L;
dfs(T);
cout <<ans << endl;
for (int i = 0; i < n; i++) {
cout << s[i] << ':' << code[i] << endl;
}
return 0;
}
相信看完代码后是不是思路十分的清晰了,马上去自己敲一遍把,堆的代码实现我会在下一篇文章给出,我坚信理解并背会模板才是硬道理。