Description
假设用于通信的电文仅由8个字母组成,字母在电文中出现的频率分别为7、19、2、6、32、3、21、10。试为这8个字母设计哈夫曼编码。如果用二进制数表示这8个字母的编码方案.(请按照左子树根节点的权小于等于右子树根节点的权的次序构造)
Input
第一行为字母的个数n;
第二行至第n+1行分别为各个字母在电文中出现的频率;
Output
按照中序遍历输出各个编码
Sample Input
8
7
19
2
6
32
3
21
10
Sample Output
19:00
21:01
2:10000
3:10001
6:1001
7:1010
10:1011
32:11
思路
哈夫曼编码板子题,首先我们要了解什么是哈夫曼编码。
主要应用在无损压缩方面,是一种通过特殊编码方式而在保证信息不会被错误翻译的情况下,靠频率来加快翻译速度的方法。
其要求为不能错误翻译且WPL(频率*二进制码长度之和)最小。
什么是不能错误翻译呢?举个例子:
A=01,B=010,C=101,D=10,E=0
010101001,你怎么翻?
AAAEA?EDDDA?ECBA?
显然是不行的,所以要更换编码。
A=001,B=10,C=010,D=111,E=101
同样是010101001,这时只能翻成CBA
为了保证二进制编码程度最短,我们需要用某种方法来构造哈夫曼编码。
哈夫曼编码对于哈夫曼树来说就是从根节点到某个节点的边集(向左走便是0,右边便是1)如A=001即从根节点去第一层左节点,再去第二层最左节点,然后去其在第三层的右儿子。
|那么我们还需要了解一下哈夫曼树。(烂番茄不要丢过来)
给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。 |
---|
——某 度 百 科 |
---|
构造方法?见代码吧(臭鸡蛋可以丢过来了)
code:
#include<iostream>
#include<cstdio>
#include<algorithm>
#include<string>
#include<cstring>
#include<queue>
using namespace std;
struct f{
int v,l,r;
} a[1000001];
int tot;
int x[10001];
int n;
string s;
void dfs(int x,int dep)
{
if (a[x].l==0&&a[x].r==0)
{
cout<<a[x].v<<':';
for (int i=0;i<dep;i++) cout<<s[i];
cout<<endl;
return;
}
if (a[x].l!=0)
{
s[dep]='0';
dfs(a[x].l,dep+1);
}
if (a[x].r!=0)
{
s[dep]='1';
dfs(a[x].r,dep+1);
}
return;
}
bool cmp(int c,int b)
{
return a[c].v>a[b].v;
}
int main()
{
cin>>n;
for (int i=1;i<=n;i++)
{
cin>>a[i].v;
x[i]=i;
}
sort(x+1,x+1+n,cmp);
for (int i=n;i>1;i--)
{
int xx=n+n-i+1;
a[xx].v=a[x[i]].v+a[x[i-1]].v;
a[xx].l=x[i];
a[xx].r=x[i-1];
int j;
for (j=i-1;j>0&&a[xx].v>a[x[j]].v;j--) x[j+1]=x[j];
x[j+1]=xx;
}
dfs(n+n-1,0);
return 0;
}