数据结构实验之二叉树六:哈夫曼编码

数据结构实验之二叉树六:哈夫曼编码

Time Limit: 1000MS  Memory Limit: 65536KB
Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input
  输入数据有多组,每组数据一行,表示要编码的字符串。
Output
  对应字符的 ASCII 编码长度 la huffman 编码长度 lh la/lh 的值 ( 保留一位小数 ) ,数据之间以空格间隔。
Example Input
AAAAABCD
THE_CAT_IN_THE_HAT
Example Output
64 13 4.9
144 51 2.8
思路:

每个字符ASCII码是占8个字节的。所以长度就是字符数×8;

对于哈夫曼编码就是哈夫曼树一样。

对于第一个串每个字符出现的长度是5111.

那么第一次出来2 队列变成5 2 1;

然后第二次出来3 队列变成5 3;

然后最后出来8  队列剩下一个8;

所以哈夫曼编码长度就是2+3+8=13;

这里是用一个优先队列来解决的,不会的可以放进一个数组里,然后你每次找一个数组中最小的数加上,放上新的数就可以了。

对于数据比较大的就用堆来实现。

这里用来记录出现的字符集合是用哈希的思想来实现的。

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <queue>
using namespace std;
const int MAXN=100+10;
char s[MAXN];
int ha[200];
int sum[200];
int main()
{
    int la,lh,l;
    int i;
    while(~scanf("%s",s))
    {

        memset(ha,0,sizeof(ha));
        l=strlen(s);
        la=l*8;
        priority_queue<int,vector<int>,greater<int> >q;
        int cnt=0;
        for(i=0; i<l; ++i)
        {
            if(!ha[s[i]])sum[cnt++]=s[i];
            ha[s[i]]++;
        }
        for(i=0;i<cnt;++i)q.push(ha[sum[i]]);
        lh=0;
        while(!q.empty())
        {
            int k1=q.top();
            q.pop();
            if(!q.empty())
            {
                int k2=q.top();
                q.pop();
                lh+=k1+k2;
                q.push(k1+k2);
            }
        }
        printf("%d %d %.1lf\n",la,lh,la*1.0/lh);
    }
    return 0;
}







  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值