问题
代码(码字):Q{001,00,010,01}表示字符a,b,c,d
同一序列:0100001
产生两种译码(产生歧义):01 00 001;010 00 01
二元前缀码:任何字符的代码不能作为其他字符代码的前缀
利用二元前缀码译码:从第一个字符开始一次读入每个字符(0或1),如果发现独到的字串与某个码字相等,就将这个子串译作相应的码字:然后从下一个字符开始继续这个过程,直到读完输入的字符串为止。
二元前缀编码存储:二叉树结构,每个字符作为树叶,对应这个字符的前缀码看作根到这片树叶的一条路径,每个节点通向做儿子的边记作0,通向右儿子的边记作1。
问题:给定字符集C={x1,x2,…,xn}和每个字符的频率f(xi),求关于C的一个最优前缀码。
解析
构造最优前缀码的贪心算法为哈夫曼算法。
设计
1、数组haftree初始化,所有数组元素的双亲、左右孩子都置为-1;
2、数组haftree的前n个元素的权值置给定权值;
3、进行n-1次合并 3.1 在二叉树集合中选取两个权值最小的根节点,其下标分别为i1,i2; 3.2 将二叉树i1、i2合并为一棵新的二叉树k。
分析
时间复杂度:O(nlogn)。
源码
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int maxn=1e4;
const int inf=0x3f3f3f3f;
int main() {
int n;
while(~scanf("%d", &n)) {
priority_queue<ll, vector<ll>, greater<ll> >q;
ll res = 0;
for (int i = 1; i <= n; ++i) {
ll x;
scanf("%lld", &x);
q.push(x);
}
while (1) {
ll a = q.top();
q.pop();
if (q.empty())break;
ll b = q.top();
q.pop();
res += a + b;
q.push(a + b);
}
printf("%lld\n", res);
}
}
Github: