题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1053
题目意思:给定一个字符串,这个字符串只由大写字母和下划线组成,在计算机中,每个字母占8个字节,如果不使用编码,所需的空间是多少字节?如果使用编码,那么所需的空间是多少字节。最后输出不使用编码所占的空间,使用编码所占的空间,以及它们的比值。
不使用编码的话,那么很显然,所占空间=字符串的长度*8
使用编码,题目所说的其实就是哈夫曼编码,也可以求出所占的空间。哈夫曼编码已经有很多人总结了,我在这里就不多说了。可以点这里看哈夫曼编码点击打开链接
明白哈夫曼编码的原理之后,你应该就能实现了,直观的想法建树解决。这个比较麻烦,这种方法就不多说了。
这里采用优先队列来计算出哈夫曼编码的最小权值。其实优先队列就是堆,也就是二叉树。
至于原理,上面给的链接的文章已经说了。
下面是AC代码:
#include<iostream>
#include<queue>
#include<cstdio>
using namespace std;
const int maxn=30;
int cnt[maxn];
struct node
{
int s;
friend bool operator<(node a,node b)
{
return a.s>b.s;
}
};
int main()
{
string s;
while(cin>>s&&s!="END")
{
fill(cnt,cnt+maxn,0);
for(int i=0;i<s.size();i++)
if(s[i]=='_') cnt[0]++;
else cnt[s[i]-'A'+1]++;
priority_queue<node>q;
node t,one,two;
for(int i=0;i<maxn;i++)
if(cnt[i]) t.s=cnt[i],q.push(t);
int ans=0;
if(q.size()==1) ans=s.size();
else
{
while(q.size()>1)
{
one=q.top();q.pop();
two=q.top();q.pop();
t.s=one.s+two.s;
ans+=t.s;
q.push(t);
}
}
printf("%d %d %.1lf\n",s.size()*8,ans,s.size()*8.0/ans);
}
return 0;
}