所谓哈夫曼树即最优二叉树,其特点是带权路径长度最小
建树原理:将最小数结点放到最下面,大数放到离顶点近的地方,建树时从下往上建,每上一层下一层的数就被重复加一次,这样最终得到完整树
数据结构实验之二叉树六:哈夫曼编码
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample Input
AAAAABCD
THE_CAT_IN_THE_HAT
Sample Output
64 13 4.9
144 51 2.8
上图中带权路径的计算方法:
1.圆圈为二叉树的各个结点,三角形为每一层的权值可认为没有路径,把三层的权值加起来j即可
2.用结点计算,最下面为最初的两个结点,他们到定点8的路径长度为3,所以带权路径长度为(1+1)*3=6。以此类推即可。
#include <stdio.h>
#include <stdlib.h>
#include<string.h>
#include <queue>
using namespace std;
int main()
{
priority_queue<int ,vector <int>,greater <int > >q;///优先队列从小到大排序,小的在队首。
int len,a[1001];
char s[1001];
while(cin>>s)
{
int sum=0;
memset(a,0,sizeof(a));
len=strlen(s);
int la=len*8;
for(int i=0;i<len;i++)
{
a[s[i]]++;
}
for(int i=0;i<150;i++)
{
if(a[i]!=0)
q.push(a[i]);
}
while(!q.empty())
{
int a=q.top();
q.pop();
if(!q.empty())
{
int b=q.top();
q.pop();
int c=a+b;
sum+=c;
q.push(c);
}
}
printf("%d %d %.1lf\n",la,sum,1.0*la/sum);
}
return 0;
}
晚安!