数据结构实验之二叉树六：哈夫曼编码

最新推荐文章于 2022-04-21 23:51:30 发布

leoxry

最新推荐文章于 2022-04-21 23:51:30 发布

阅读量453

点赞数

分类专栏：数据结构-树-堆数据结构-二叉树数据结构-数组数据结构-队列文章标签：数据结构二叉树编码哈夫曼编码

本文链接：https://blog.csdn.net/BlessingXRY/article/details/54958638

版权

数据结构-二叉树同时被 3 个专栏收录

23 篇文章 0 订阅

订阅专栏

数据结构-队列

16 篇文章 0 订阅

订阅专栏

数据结构-数组

11 篇文章 0 订阅

订阅专栏

sdut原题链接
 sdut原题代码链接
数据结构实验之二叉树六：哈夫曼编码
Time Limit: 1000MS Memory Limit: 65536KB

Problem Description
字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼编码常被用于数据文件压缩中，其压缩率通常在20%～90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input
输入数据有多组，每组数据一行，表示要编码的字符串。

Output
对应字符的ASCII编码长度la，huffman编码长度lh和la/lh的值(保留一位小数)，数据之间以空格间隔。

Example Input
AAAAABCD
THE_CAT_IN_THE_HAT

Example Output
64 13 4.9
144 51 2.8

Hint

Author
xam

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define MINDATA -1
typedef struct HNode *Heap;
struct HNode
{
    int *Data;
    int Size;
};
typedef Heap MinHeap;
MinHeap CreatHeap(int maxsize)//最小堆的创建函数
{
    MinHeap H = (MinHeap)malloc(sizeof(struct HNode));
    H->Data = (int *)malloc((maxsize+1)*sizeof(int));
    H->Data[0] = MINDATA;
    H->Size = 0;
    return H;
}
void Insert(MinHeap H, int x)//最小堆的元素插入函数
{
    int i;
    i = ++H->Size;
    for(; H->Data[i/2] > x; i/=2)
        H->Data[i] = H->Data[i/2];
    H->Data[i] = x;
}
int Delete(MinHeap H)//最小堆的删除函数
{
    int MinItem, x, parent, child;
    MinItem = H->Data[1];
    x = H->Data[H->Size--];
    for(parent = 1; parent*2 <= H->Size; parent = child)
    {
        child = parent*2;
        if((child != H->Size) && H->Data[child] > H->Data[child+1])
            child++;
        if(x <= H->Data[child])
            break;
        else
            H->Data[parent] = H->Data[child];
    }
    H->Data[parent] = x;
    return MinItem;
}
void PercDown(MinHeap H, int p)
{
    int parent, child, x;
    x = H->Data[p];
    for(parent = p; parent*2 <= H->Size; parent = child)
    {
        child = parent*2;
        if((child != H->Size) && H->Data[child] > H->Data[child+1])
            child++;
        if(x <= H->Data[child])
            break;
        else
            H->Data[parent] = H->Data[child];
    }
    H->Data[parent] = x;
}
void BuildHeap(MinHeap H)//最小堆的建立函数
{
    int i;
    for(i = H->Size/2; i > 0; i--)
        PercDown(H, i);
}
int main()
{
    double la, lh, ah;
    int len, i;
    char s[199859];
    while(scanf("%s", s) != EOF)
    {
        int n, x1, x2, y, count[256] = {0};///初始化
        MinHeap H1;
        H1 = CreatHeap(256);//最小堆的创建操作
        lh = 0;///初始化

        len = strlen(s);
        la = len*8;
        for(i = 0; i < len; i++)
        {
            count[s[i]]++;
        }
        for(i = 0; i < 256; i++)
        {
            if(count[i] != 0)
            {
                H1->Data[++H1->Size] = count[i];
                //printf("H1->date[]:%d\n", count[i]);
                //printf("H1->Size:%d\n", H1->Size);
            }
        }
        BuildHeap(H1);//最小堆的建立操作
        n = H1->Size;///H1->Size在删除操作中会发生改变，因此应该提前记录堆中的元素个数
        for(i = 0; i < n-1; i++)
        {
            x1 = Delete(H1);//最小堆的删除操作
            x2 = Delete(H1);//最小堆的删除操作
            y = x1 + x2;
            lh += y;
            Insert(H1, y);//最小堆的插入操作
            ///printf("lh:%.0lf\n", lh);
        }
        ah = la/lh;
        printf("%.0lf %.0lf %.1lf\n", la, lh, ah);
    }
    return 0;
}


/***************************************************
User name: jk160630
Result: Accepted
Take time: 0ms
Take Memory: 116KB
Submit time: 2017-02-09 21:47:31
****************************************************/

参考博客中有一个例题，感谢博客作者的启迪，谢谢。
例题：一组字符(a,b,c,d)在文中出现的次数分别为(7,6,3,5),字符＇d＇的哈夫曼编码的长度为？

首先构造huffman树
每一步都将所有数字排序
方法如下:
1:
3 5 6 7
2:
6 7 8
/ \
3 5
3:
8 13
/ \ / \
3 5 6 7
4:
21
/ \
8 13
/ \ / \
3 5 6 7
所以构造哈夫曼树如图
7 6 3 5 分别对应a b c d
如果左边为0 ,右边为 1 ,则他们编码分别为:
a 11
b 10
c 00
d 01
长度为2

leoxry

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构实验之二叉树六：哈夫曼编码

sdut原题链接 sdut原题代码链接数据结构实验之二叉树六：哈夫曼编码 Time Limit: 1000MS Memory Limit: 65536KBProblem Description 字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码
复制链接

扫一扫