#POJ1521#Huffman编码

 [POJ1521]Huffman编码

时间限制: 1 Sec  内存限制: 128 MB

题目描述

输入一个字符串,长度不超过100,仅由大写字母和下划线分组成。求用最好的字符编码方式,令总长度最小。

输入

多组数据,每组数据在一行上输入一个字符串,格式如前所述
当遇到END时,表示输入结束。

输出

对应每个输入,在一行上输出3个信息:首先是每个字母按固定长度8bit编码,字符串的总长度,然后是按最优编码的总长度,最后是前者对后者的比率,保留1位小数。

样例输入

AAAAABCD
THE_CAT_IN_THE_HAT
END

样例输出

64 13 4.9
144 51 2.8
【解】:
1,每个字母有固定长度8bit,则有字符串总长度为有效字符数*8。
2,以字符在字符串中出现的次数为权值,每次选择其中权值最小的两个节点生成一个新的节点建树。
3,[ 高亮 ! ]因为本题只要求最优编码的总长度(即在建成的huffman树中扫描字符,字符所在叶子节点的深度即为当前字符的编码长度,将所有字符编码长度相加),并未要求打印出编码,所以并不需要建树来扫描字符寻找深度,直接用优先队列将所有的字符出现次数进行运算即可。
4,注意所开数组大小必须保证能够容纳输入范围内的ascii码值,否则将溢出。

#include<cstdio>
#include<iostream>
#include<cstring>
#include<queue>
using namespace std;
char s[150];
int k[100];
priority_queue<int,vector<int>,greater<int> >que;//小根堆:权值从小到大
int main(){
	int n,i,a,b,sum;
	while(scanf("%s",s)){
		if(!strcmp(s,"END"))
			break;
		sum=0;
		n=strlen(s);
		printf("%d ",8*n);
		for(i=0;i<n;i++)//计算出现次数
			k[s[i]]++;
		for(i=0;i<100;i++)//进队
			if(k[i]){
				que.push(k[i]);
				k[i]=0;//还原
			}
		while(que.size()>1){//权值计算,注意队列中最后生成一个根时,已经计算完毕,此时应马上退出
			a=que.top();que.pop();
			b=que.top();que.pop();
			sum+=a+b;
			que.push(a+b);
		}
		que.pop();
		if(sum==0)sum=n;//特殊情况:只有一个字符时
		printf("%d %.1lf\n",sum,double(n*8)/sum);
		memset(s,'\0',sizeof(s));
		//memset(k,0,sizeof(k));此处因为前方22行已经还原,则不再清零。
	}
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值