数据结构实验之二叉树六:哈夫曼编码

Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample Input
AAAAABCD
THE_CAT_IN_THE_HAT
Sample Output
64 13 4.9
144 51 2.8

AC代码:
#include <iostream>
#include <cstdlib>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
void qsort(char q[],int left,int right)
{
    if(left>=right)
        return;
    char key = q[left], i =left,j = right;
    while(i<j)
    {
        while(i<j&&q[j]>=key)
            j--;
        q[i]=q[j];
        while(i<j&&q[i]<=key)
            i++;
        q[j]=q[i];
    }
    q[i] = key;
    qsort(q,left,i);
    qsort(q,i+1,right);
    return;
}
int main()
{
    char str[1005];
    while(~scanf("%s",str))
    {
        int len = strlen(str);
        //这里注意的是任何的ASCII值都是8位二进制数字(国际上是7位,了解一下就行)。
        int s1 = len*8;
        char q[1005];
        int in = 0;
        int out = 0;
        int sum[260] = {0};
        //一定要注意的是出现的次数,而不是原来的数值。这个很关键。
        for(int i=0;i<len;i++)
            sum[str[i]]++;
        //将出现的次数入队列。
        for(int i=0;i<260;i++)
            if(sum[i]!=0)
            q[in++] = sum[i];
        qsort(q,out,in-1);
        int s2 = 0;
        //一个数的时候截至。
        while(in-out>=2)
        {
            char x = q[out++];
            char y = q[out++];
            //其实正确的方式是节点数值出现的次数乘以该次数所在的层数。
            //这种方法很巧妙,用的数学上的知识。效果一样。
            s2 = s2 + x + y;
            q[in++] = x + y;
            qsort(q,out,in-1);
        }
        printf("%d %d %.1f\n",s1,s2,s1*1.0/s2);
    }
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值