数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS Memory Limit: 65536K
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
**Outpu**t
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Example Input
AAAAABCD
THE_CAT_IN_THE_HAT
Example Output
64 13 4.9
144 51 2.8
#include <bits/stdc++.h>
using namespace std;
int main()
{
char a[1000];
int v[1000];
int la, lh;
while(cin >> a)
{
int len = strlen(a);
memset(v,0,sizeof(v));
la = 8 * len; //一个ASCII码值占一个字节(8个二进制位)
priority_queue<int,vector<int>,greater<int> >q; //优先队列
for(int i = 0; i < len; i++)
v[a[i]]++;
for(int i = 0; i < 200; i++)
{
if(v[i] != 0)
q.push(v[i]);
}
lh = 0;
while(!q.empty())
{
int n = q.top();
q.pop();
if(!q.empty())
{
int m = q.top();
q.pop();
q.push(n+m);
lh += (n+m);
}
}
printf("%d %d %.1lf\n", la, lh, 1.0*la/lh);
}
return 0;
}