数据结构实验之二叉树六：哈夫曼编码

最新推荐文章于 2017-08-14 17:31:59 发布

BackToMeNow

最新推荐文章于 2017-08-14 17:31:59 发布

阅读量371

点赞数

分类专栏：数据结构与算法文章标签：数据结构二叉树编码哈弗曼树

本文不知道博主是从哪里乱看来的，请随意转载 QQ:772604175

本文链接：https://blog.csdn.net/qq_36525906/article/details/77097710

版权

数据结构与算法专栏收录该内容

141 篇文章 5 订阅

订阅专栏

数据结构实验之二叉树六：哈夫曼编码
Time Limit: 1000MS Memory Limit: 65536KB
Submit Statistic
Problem Description

字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼编码常被用于数据文件压缩中，其压缩率通常在20%～90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input

输入数据有多组，每组数据一行，表示要编码的字符串。
Output

对应字符的ASCII编码长度la，huffman编码长度lh和la/lh的值(保留一位小数)，数据之间以空格间隔。
Example Input

AAAAABCD
THE_CAT_IN_THE_HAT
Example Output

64 13 4.9
144 51 2.8
Hint

Author

xam

PS：哈弗曼编码等等一系列的哈弗曼问题，同时可以理解为优先队列问题，在队列中，小的先出队，一层一层累加，最后即为最终的哈弗曼码。（队列模拟树）

优先队列详解传送：http://blog.csdn.net/qq_36525906/article/details/77161390

#include<bits/stdc++.h>

using namespace std;

int main()
{
    char s[10000];
    while(scanf("%s",s)!=EOF)
    {
        priority_queue < int,vector<int>,greater<int> > Q;
        int len=strlen(s);
        int i,max=0;
        int count[256]= {0};

        for(i=0; i<len; i++)
        {
            count[(int)s[i]]++;//注意这个地方，count[]的有效下标至少是从48开始的
            if(s[i]>max)
                max=s[i];
        }

        for(i=0; i<=max; i++)//因为count从48开始，所以这个地方才用max做结束限制
        {
            if(count[i]!=0)
                Q.push(count[i]);
        }

        int sum=0;
        while(!Q.empty())
        {
            int a=Q.top();
            Q.pop();
            if(!Q.empty())//判空
            {
                int b=Q.top();
                Q.pop();
                sum+=(a+b);
                Q.push(a+b);//注意把两颗子树的和也放入队列，成为上一个节点的子树之一
            }
        }

        printf("%d %d %.1f\n",len*8,sum,len*8.0/sum);
    }
    return 0;
}

BackToMeNow

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构实验之二叉树六：哈夫曼编码

数据结构实验之二叉树六：哈夫曼编码 Time Limit: 1000MS Memory Limit: 65536KB Submit Statistic Problem Description字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼
复制链接

扫一扫

专栏目录