数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS Memory Limit: 65536KB
Submit Statistic
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Example Input
AAAAABCD
THE_CAT_IN_THE_HAT
Example Output
64 13 4.9
144 51 2.8
Hint
Author
xam
PS:哈弗曼编码等等一系列的哈弗曼问题,同时可以理解为优先队列问题,在队列中,小的先出队,一层一层累加,最后即为最终的哈弗曼码。(队列模拟树)
优先队列详解传送:http://blog.csdn.net/qq_36525906/article/details/77161390
#include<bits/stdc++.h>
using namespace std;
int main()
{
char s[10000];
while(scanf("%s",s)!=EOF)
{
priority_queue < int,vector<int>,greater<int> > Q;
int len=strlen(s);
int i,max=0;
int count[256]= {0};
for(i=0; i<len; i++)
{
count[(int)s[i]]++;//注意这个地方,count[]的有效下标至少是从48开始的
if(s[i]>max)
max=s[i];
}
for(i=0; i<=max; i++)//因为count从48开始,所以这个地方才用max做结束限制
{
if(count[i]!=0)
Q.push(count[i]);
}
int sum=0;
while(!Q.empty())
{
int a=Q.top();
Q.pop();
if(!Q.empty())//判空
{
int b=Q.top();
Q.pop();
sum+=(a+b);
Q.push(a+b);//注意把两颗子树的和也放入队列,成为上一个节点的子树之一
}
}
printf("%d %d %.1f\n",len*8,sum,len*8.0/sum);
}
return 0;
}