Entropy 题解

题目链接

题目描述

输入一个字符串,分别用普通ASCII编码(每个字符8bit)和Huffman编码,输出两者编码后的长度,以及压缩比(即编码后两者相除的结果)

样例输入

AAAAABCD
THE_CAT_IN_THE_HAT
END

样例输出

64 13 4.9
144 51 2.8

算法1

(贪心->Huffman树) O ( n l o g n ) O(nlogn) O(nlogn)

本题先统计每个字符的频数,然后按频数的大小排序,之后从小往大贪心地枚举每一个数的频数大小并相加,就可以使得频数大的编码短且频数小的编码长,这样一来就可以是整体字母的编码最短。这其实就是Huffman编码方式。

这里画个图表示下样例一的Huffman树:
请添加图片描述

另注:这里的Huffman树我是用优先队列来维护,这样提取频数最小值比较方便~~

C++ 代码
#include<iostream>
#include<queue>
#include<string>
#include<algorithm>
#include<cstdio>
using namespace std;

int main()
{
    string s;
    while(cin >> s && s != "END"){
        int cnt = 1,len = 0;
        priority_queue<int,vector<int>,greater<int> > heap;
        sort(s.begin(),s.end());
        int l = s.size();

        for(int i = 1;i < l;i ++){
            if(s[i] != s[i - 1]){
               heap.push(cnt);
               cnt = 1;
            }
            else cnt ++;
        }

        heap.push(cnt);
        if(heap.size() == 1) len += heap.top();

        while (heap.size() > 1){
            int a = heap.top();heap.pop();
            int b = heap.top();heap.pop();
            heap.push(a + b);
            len += (a + b);
        }
        heap.pop();

        printf("%d %d %.1f\n",l * 8,len,(l * 8.0) / len);
    }
    return 0;
}


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

marvel121

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值