数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000 ms Memory Limit: 65536 KiB
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample Input
AAAAABCD THE_CAT_IN_THE_HAT
Sample Output
64 13 4.9 144 51 2.8
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <iostream>
#include <algorithm>
using namespace std;
int a[1000],b[1000],size;
bool cmp (int x, int y)
{
return x>y;
}
void in(int x)
{
b[size]=x;
size++;
sort(b,b+size,cmp);
}
int main()
{
char s[1000];
int i,la,huf;
while(scanf("%s",s)!=EOF)
{
int n=strlen(s);
size=0;
huf=0;
la=n*8;
memset(a,0,sizeof(a));
memset(b,0,sizeof(b));
for(i=0;i<n;i++)
{
a[s[i]]++;
}
for(i=0;i<500;i++)
{
if(a[i]!=0) in(a[i]);
}
while(size>1)
{
int x=b[size-1];
size--;
int y=b[size-1];
size--;
int sum=x+y;
in(sum);
huf+=sum;
}
printf("%d %d %.1lf\n",la,huf,(double)la*1.0/(double)huf);
}
return 0;
}