数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS
Memory Limit: 65536KB
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的
ASCII
编码长度
la
,
huffman
编码长度
lh
和
la/lh
的值
(
保留一位小数
)
,数据之间以空格间隔。
Example Input
AAAAABCD THE_CAT_IN_THE_HAT
Example Output
64 13 4.9 144 51 2.8
纯C码
#include<stdio.h>
#include<string.h>
char ch[500];
int num[500];
int pai(int a[], int low, int high)
{
int k = a[low];
while(low < high)
{
while(low < high && (a[high] >= k))high--;
a[low] = a[high];
while(low < high && (a[low] <= k))low++;
a[high] = a[low];
}
a[low] = k;
return low;
}
void qsort(int a[], int left, int right)//快排
{
int m;
if(left < right)
{
m = pai(a, left, right);
pai(a, left, m - 1);
pai(a, m + 1, right);
}
}
int main()
{
int i;
while(~scanf("%s", ch))
{
int len = strlen(ch);
int sum1 = len * 8;
memset(num, 0, sizeof(num));
int queue[100];
int k = 0;
int count = 0;
for(i = 0; i <= len - 1; i++)
{
num[ch[i]]++;//记录各字母个数
}
memset(queue, 0, sizeof(queue));
for(i = 0; i <= 500; i++)
{
if(num[i] != 0)
queue[k++] = num[i];//该队列存储个字母数目
}
int sum = 0;
int sum2 = 0;
while(k - count >= 2)
{
qsort(queue, count, k - 1);//快排
int x1 = queue[count];
count++;
int x2 = queue[count];
count++;
sum = (x1 + x2);
sum2 = sum2 + sum;
queue[k++] = sum;
}
printf("%d %d %.1lf\n", sum1, sum2, sum1 * 1.0 / sum2);
}
return 0;
}