最优二叉树

所谓哈夫曼树即最优二叉树,其特点是带权路径长度最小
建树原理:将最小数结点放到最下面,大数放到离顶点近的地方,建树时从下往上建,每上一层下一层的数就被重复加一次,这样最终得到完整树
数据结构实验之二叉树六:哈夫曼编码

Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample Input
AAAAABCD
THE_CAT_IN_THE_HAT
Sample Output
64 13 4.9
144 51 2.8
在这里插入图片描述

上图中带权路径的计算方法:
1.圆圈为二叉树的各个结点,三角形为每一层的权值可认为没有路径,把三层的权值加起来j即可
2.用结点计算,最下面为最初的两个结点,他们到定点8的路径长度为3,所以带权路径长度为(1+1)*3=6。以此类推即可。

#include <stdio.h>
#include <stdlib.h>
#include<string.h>
#include <queue>
using namespace std;

int main()
{
priority_queue<int ,vector <int>,greater <int > >q;///优先队列从小到大排序,小的在队首。
int len,a[1001];
char s[1001];
while(cin>>s)
{
    int sum=0;
    memset(a,0,sizeof(a));
    len=strlen(s);
    int la=len*8;
    for(int i=0;i<len;i++)
    {
        a[s[i]]++;
    }
    for(int i=0;i<150;i++)
    {
        if(a[i]!=0)
            q.push(a[i]);
    }
    while(!q.empty())
    {
        int a=q.top();
        q.pop();
        if(!q.empty())
        {
           int b=q.top();
           q.pop();
           int c=a+b;
           sum+=c;
           q.push(c);
        }
    }
    printf("%d %d %.1lf\n",la,sum,1.0*la/sum);
}
    return 0;
}

晚安!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值