数据结构实验之二叉树六：哈夫曼编码_a - 数据结构实验之二叉树六:哈夫曼编码-CSDN博客

本文链接：https://blog.csdn.net/weixin_44153125/article/details/89969372

本文介绍数据结构实验中的哈夫曼编码，一种基于字符出现概率的可变字长编码。主要讨论如何使用哈夫曼编码进行数据压缩，并提供了一个计算ASCII编码与哈夫曼编码长度比值的问题实例。

摘要由CSDN通过智能技术生成

数据结构实验之二叉树六：哈夫曼编码

Time Limit: 1000 ms Memory Limit: 65536 KiB

Problem Description

字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼编码常被用于数据文件压缩中，其压缩率通常在20%～90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input

输入数据有多组，每组数据一行，表示要编码的字符串。

Output

对应字符的ASCII编码长度la，huffman编码长度lh和la/lh的值(保留一位小数)，数据之间以空格间隔。

Sample Input

AAAAABCD
THE_CAT_IN_THE_HAT

Sample Output

64 13 4.9
144 51 2.8

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <iostream>
#include <algorithm>
using namespace std;
int a[1000],b[1000],size;
bool cmp (int x, int y)
{
    return x>y;
}
void in(int x)
{
    b[size]=x;
    size++;
    sort(b,b+size,cmp);
}

int main()
{
    char s[1000];
    int i,la,huf;
    while(scanf("%s",s)!=EOF)
    {
        int n=strlen(s);
        size=0;
        huf=0;
        la=n*8;
        memset(a,0,sizeof(a));
        memset(b,0,sizeof(b));
        for(i=0;i<n;i++)
        {
            a[s[i]]++;
        }
        for(i=0;i<500;i++)
        {
            if(a[i]!=0) in(a[i]);
        }
        while(size>1)
        {
            int x=b[size-1];
            size--;
            int y=b[size-1];
            size--;
            int sum=x+y;
            in(sum);
            huf+=sum;
        }
        printf("%d %d %.1lf\n",la,huf,(double)la*1.0/(double)huf);
    }
    return 0;
}