Entropy(哈夫曼编码)
题目
题目点这里
大概意思是若使用固定长度编码太浪费,可对于不同出现频率的字母采用不同长度的编码,求一种编码方式,使其总长度最小。
输入
输入一行一串字符,以“END”结束。
输出
对于每串字符,输出其ASCII码长度、题目要求编码的长度以及这两者之间的比。
思路
对于ASCII编码,其每个字符编码的长度固定为8,用字符串的长度乘以8即可求出。
题目要求的编码方式即为哈夫曼编码,也就是每次选取最小两个节点合并成一个节点。因此这道题需要先统计字符串的长度及每个字符出现的次数,然后构造哈夫曼树,最后求出每个字符的编码长度。
在这道题中,题目只要求所有字符编码的总长度,也就是哈夫曼树的最小带权路径长度,不要求哈夫曼树的结构,因此可以使用小顶堆来实现,也就是升序的优先队列。每次只需取出队列顶部最小的两个数,求出它们的和并入队,直到队列中只剩一个数,由哈夫曼树的最小带权路径长度即为其非叶子节点的和可知,该数即为所求的字符串的编码的长度。
若只有一种字符,则其哈夫曼编码长度为字符串的长度。
代码
#include<stdio.h>
#include<iostream>
#include<string>
#include<queue>
#include<map>
using namespace std;
int main()
{
string s;
int a,b,lsum = 0