数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS
Memory Limit: 65536KB
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的
ASCII
编码长度
la
,
huffman
编码长度
lh
和
la/lh
的值
(
保留一位小数
)
,数据之间以空格间隔。
Example Input
AAAAABCD THE_CAT_IN_THE_HAT
Example Output
64 13 4.9 144 51 2.8
#include<iostream> #include<set> #include<cstdio> #include<cstring> #include<algorithm> using namespace std; char a[10000]; char b[1000]; int main() { int i,n,len; while(cin>>a) { len = strlen(a); n = len * 8; memset(b,0,sizeof(b)); for(i = 0; i < len; i++) { b[(int)a[i]]++; } multiset<int >q; for(i = 0; i <= 500; i++) { if(b[i] != 0) { q.insert(b[i]); } } int x1; int x2; int k = 0; while(!q.empty()) { x1 = *(q.begin()); q.erase(q.begin()); if(!q.empty()) { x2 = *(q.begin()); q.erase(q.begin()); q.insert(x1 + x2); k = k + (x1 + x2); } } double mn; mn = (double)n/k; printf("%d %d %.1lf\n",n,k,mn); } return 0; }