[POJ1521]Huffman编码
时间限制: 1 Sec 内存限制: 128 MB
题目描述
输入一个字符串,长度不超过100,仅由大写字母和下划线分组成。求用最好的字符编码方式,令总长度最小。
输入
多组数据,每组数据在一行上输入一个字符串,格式如前所述
当遇到END时,表示输入结束。
输出
对应每个输入,在一行上输出3个信息:首先是每个字母按固定长度8bit编码,字符串的总长度,然后是按最优编码的总长度,最后是前者对后者的比率,保留1位小数。
样例输入
AAAAABCD THE_CAT_IN_THE_HAT END
样例输出
64 13 4.9
144 51 2.8
【解】:
1,每个字母有固定长度8bit,则有字符串总长度为有效字符数*8。
2,以字符在字符串中出现的次数为权值,每次选择其中权值最小的两个节点生成一个新的节点建树。
3,[ 高亮 ! ]因为本题只要求最优编码的总长度(即在建成的huffman树中扫描字符,字符所在叶子节点的深度即为当前字符的编码长度,将所有字符编码长度相加),并未要求打印出编码,所以并不需要建树来扫描字符寻找深度,直接用优先队列将所有的字符出现次数进行运算即可。
4,注意所开数组大小必须保证能够容纳输入范围内的ascii码值,否则将溢出。
#include<cstdio>
#include<iostream>
#include<cstring>
#include<queue>
using namespace std;
char s[150];
int k[100];
priority_queue<int,vector<int>,greater<int> >que;//小根堆:权值从小到大
int main(){
int n,i,a,b,sum;
while(scanf("%s",s)){
if(!strcmp(s,"END"))
break;
sum=0;
n=strlen(s);
printf("%d ",8*n);
for(i=0;i<n;i++)//计算出现次数
k[s[i]]++;
for(i=0;i<100;i++)//进队
if(k[i]){
que.push(k[i]);
k[i]=0;//还原
}
while(que.size()>1){//权值计算,注意队列中最后生成一个根时,已经计算完毕,此时应马上退出
a=que.top();que.pop();
b=que.top();que.pop();
sum+=a+b;
que.push(a+b);
}
que.pop();
if(sum==0)sum=n;//特殊情况:只有一个字符时
printf("%d %.1lf\n",sum,double(n*8)/sum);
memset(s,'\0',sizeof(s));
//memset(k,0,sizeof(k));此处因为前方22行已经还原,则不再清零。
}
}