数据结构实验之二叉树六:哈夫曼编码

数据结构实验之二叉树六:哈夫曼编码

Time Limit: 1000MS  Memory Limit: 65536KB
Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input
  输入数据有多组,每组数据一行,表示要编码的字符串。
Output
  对应字符的 ASCII 编码长度 la huffman 编码长度 lh la/lh 的值 ( 保留一位小数 ) ,数据之间以空格间隔。
Example Input
AAAAABCD
THE_CAT_IN_THE_HAT
Example Output
64 13 4.9
144 51 2.8
Hint
 
Author


先说一下哈夫曼编码:

设某信源产生有五种符号u1、u2、u3、u4和u5,对应概率P1=0.4,P2=0.1,P3=P4=0.2,P5=0.1。首先,将符号按照概率由大到小排队,编码时,从最小概率的两个符号开始,可选其中一个支路为0,另一支路为1。这里,我们选上支路为0,下支路为1。再将已编码的两支路的概率合并,并重新排队。多次重复使用上述方法直至合并概率归一时为止。可能出现两者虽平均码长相等,但同一符号可以有不同的码长,即编码方法并不唯一,其原因是两支路概率合并后重新排队时,可能出现几个支路概率相等,造成排队方法不唯一。一般,若将新合并后的支路排到等概率的最上支路,将有利于缩短码长方差,且编出的码更接近于等长码。
简单来说在此题的理解中就是把给定的字符串中的ASCII码中的编号出现的频率按照从小到大的顺序排列,然后每次从其中挑出两个最小的相加,然后放入继续排序,这两个数的和暂存下来,每次都加上新产生最小的和,最后的结果就是所求的编码。详见百度文库:点击打开链接

这个题最简单的就是用STL优先队列来做,由于平时的测试不能用STL的固定模板,所以手写了一个数组+快排模拟的优先队列
#include <iostream>
#include <string.h>
#include <stdio.h>
using namespace std;

void qsort(int a[], int low, int high)  //从小到大快排
{
    int x = a[low], i = low, j = high;
    if(low >= high)
        return;
    while(i < j)
    {
        if(i < j && a[j] >= x)
            j--;
        a[i] = a[j];
        if(i < j && a[i] <= x)
            i++;
        a[j] = a[i];
    }
    a[i] = x;
    qsort(a,low, i - 1);
    qsort(a,i + 1, high);
}

int main()
{
    ios::sync_with_stdio(false);
    char s[1000];
    int t[500];                         //将字符串中的字符转化为ASCII码中的编号存入数组中,并且记录个数
    int q[1000];
    while(cin >> s)
    {
        int sum1, sum2 = 0;             //初始化
        int top = 0, rear = 0;
        memset(t, 0, sizeof(t));        //初始化t中默认值全为0
        int len = strlen(s);
        sum1 = 8 * len;                 //ASCII码每个字符占8个字节
        for(int i = 0; i < len; i++)    //将字符按照ASCII码中的编号存入中间数组,会记录下出现的次数
            t[s[i]]++;
        for(int i = 0; i < 500; i++)
        {
            if(t[i] != 0)
                q[top++] = t[i];        //将出现的次数放入队列中
        }
        qsort(q, 0, top- 1);            //对队列快排
        while(top != rear)
        {
            int x1 = q[rear++];         //取出最小的两个也就是队列最开始两个,相加产生的新数据存入队列中然后快排
            if(top != rear)             //直到结束
            {
                int x2 = q[rear++];
                sum2 = sum2 + (x1 + x2);
                q[top++] = x1 + x2;
                qsort(q, rear, top - 1);
            }
        }
        printf("%d %d %.1lf\n", sum1, sum2, 1.0 * sum1 / sum2);
    }
    return 0;
}


  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值