数据结构实验之二叉树六:哈夫曼编码

数据结构实验之二叉树六:哈夫曼编码

Time Limit: 1000ms   Memory limit: 65536K  有疑问?点这里^_^

题目描述

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

输入

  输入数据有多组,每组数据一行,表示要编码的字符串。

输出

  对应字符的 ASCII 编码长度 la huffman 编码长度 lh la/lh 的值 ( 保留一位小数 ) ,数据之间以空格间隔。

示例输入

AAAAABCD
THE_CAT_IN_THE_HAT

示例输出

64 13 4.9
144 51 2.8

提示

 哈夫曼编码问题实质上就是一个求最优二叉树的问题,但也可以用数组来做,大体思想就是先把每个字母出现的次数求出来,然后由小到大排序,取前两个最小的数值相加保存到一个队列中,然后用相加后的值取代数组中前两个最小的值,这个过程循环进行,并把队列中的数值依次相加,队列中相加的值即为所求。然而这个算法的效率较为低下,当数组很大的时候,就会超时!
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include<algorithm>
#include<malloc.h>
using namespace std;

char tree[500];字符串
int num[500];//统计字符个数

bool cmp(int x,int y)//将字符串个数排序
{
    return x<y;
}

int main()
{
    while(~scanf("%s",&tree))
    {
        int len;
        len=strlen(tree);
        int sum=0;//哈弗曼码数
        int summ=0;//ACLL编码数量
        summ=len*8;
        int queue[100];//用一个队列来保存数组中相加的数
        int k=0;
        int count=0;
        memset(num,0,sizeof(num));//将计数的数组初始化全部为0;
        for(int i=0;i<len;i++)//统计字符个数
        {
            num[tree[i]]++;
        }
        for(int i=0;i<500;i++)//将字符个数保存起来
        {
            if(num[i]!=0)
            {
                queue[k++]=num[i];
            }
        }
        while(k-count>=2)//注意边界循环条件
        {
            sort(queue+count,queue+k);//排序的范围
            int x1=queue[count];
            count++;
            int x2=queue[count];
            count++;
            queue[k++]=x1+x2;
            sum+=x1+x2;
        }
        printf("%d %d %.1lf\n",summ,sum,double((summ+0.0)/(sum+0.0)));//输出时强制类型转换
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值