哈夫曼编码

最新推荐文章于 2024-06-06 10:01:02 发布

mouse_1996

最新推荐文章于 2024-06-06 10:01:02 发布

阅读量1.3k

点赞数 4

分类专栏：编程语言树

本文链接：https://blog.csdn.net/mouse_1996/article/details/52184322

版权

编程语言同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

树

3 篇文章 0 订阅

订阅专栏

数据结构实验之二叉树六：哈夫曼编码

Time Limit: 1000MS Memory limit: 65536K

题目描述

字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼编码常被用于数据文件压缩中，其压缩率通常在20%～90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

输入

输入数据有多组，每组数据一行，表示要编码的字符串。

输出

对应字符的 ASCII 编码长度 la ， huffman 编码长度 lh 和 la/lh 的值 ( 保留一位小数 ) ，数据之间以空格间隔。

示例输入

AAAAABCD
THE_CAT_IN_THE_HAT

示例输出

64 13 4.9
144 51 2.8

#include<bits/stdc++.h>

using namespace std;

typedef struct node
{
    int data;
    int parent,lchild,rchild;
} HTree;
HTree t[10010];

void chazhao(HTree t[],int k,int *s1,int *s2)
{
    int i;
    for(i=1; i<k&&t[i].parent!=0; i++)
    {

    }
    *s1=i;
    for(i=1; i<k; i++)
    {
        if(t[i].data<t[*s1].data&&!t[i].parent)
            *s1=i;
    }
    for(i=1; i<k; i++)
    {
        if(!t[i].parent&&i!=*s1)
            break;
    }
    *s2=i;
    for(i=1; i<k; i++)
    {
        if(t[i].data<t[*s2].data&&!t[i].parent&&i!=*s1)
            *s2=i;
    }
}

void build(int n)
{
    int m;
    m=2*n-1;
    for(int i=1; i<=m; i++)
    {
        t[i].parent=t[i].lchild=t[i].rchild=0;
    }
    int s1,s2;
    for(int i=n+1; i<=m; i++)
    {
        chazhao(t,i,&s1,&s2);
        t[s1].parent=t[s2].parent=i;
        t[i].lchild=s1;
        t[i].rchild=s2;
        t[i].data=t[s1].data+t[s2].data;
        //printf("%d %d %d\n",t[i].data,t[t[i].lchild].data,t[t[i].rchild].data);
    }
}

int main()
{
    int n,l,num[300];
    char a[10010];
    while(~scanf("%s",a))
    {
        memset(t,0,sizeof(0));
        memset(num,0,sizeof(num));
        l=strlen(a);
        for(int i=0; i<l; i++)
            num[(int)a[i]]++;
        int k=1;
        for(int i=0; i<300; i++)
            if(num[i])
                t[k++].data=num[i];
        n=k-1;
        build(n);
        int s=0;
        for(int i=1; i<=2*n-1; i++)
        {
            if(i>=n+1)
                s+=t[i].data;
            else if(!t[i].parent)
                s+=t[i].data;
        }
        printf("%d %d %.1lf\n",8*l,s,8.0*l/s);
    }
    return 0;
}

mouse_1996

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
哈夫曼编码

数据结构实验之二叉树六：哈夫曼编码Time Limit: 1000MS Memory limit: 65536K题目描述字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼编码常被用于数据文件压缩中
复制链接

扫一扫

专栏目录