Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample
Input
AAAAABCD
THE_CAT_IN_THE_HAT
Output
64 13 4.9
144 51 2.8
Hint
#include<bits/stdc++.h>
using namespace std;
int main()
{
char s[10000];
while(~scanf("%s", s))
{
priority_queue < int, vector<int>, greater<int> > Q;//利用优先队列,从小到大排序
int len = strlen(s);
int i, Max = 0;
int cnt[256];
memset(cnt, 0, sizeof(cnt));
for(i = 0; i < len; i++)
{
cnt[s[i]]++;//统计每个字符出现的频率,利用ASCII对应其数组下标
if(s[i] > Max)
{
Max = s[i];//找出频率最高的字符,Max的值代表这频率最高的字符的下标
}
}
for(i = 0; i <= Max; i++)
{
if(cnt[i] != 0)
Q.push(cnt[i]);//吧字符出现的次数压入优先队列
}
int sum = 0;
while(!Q.empty())
{
int a = Q.top();
Q.pop();
if(!Q.empty())
{
int b = Q.top();
Q.pop();
sum += (a + b);
Q.push(a+b);
}
}
printf("%d %d %.1f\n", len * 8, sum, len * 8.0 / sum);
}
return 0;
}