《数据压缩》实验报告三·Huffman编解码算法实现与压缩效率分析

最新推荐文章于 2021-05-18 04:51:00 发布

ininw

最新推荐文章于 2021-05-18 04:51:00 发布

阅读量1.3k

点赞数

分类专栏：实验报告

本文链接：https://blog.csdn.net/ininw/article/details/71908415

版权

本文是关于数据压缩的实验报告，重点探讨了Huffman编解码算法的实现细节。在实现过程中，使用二叉树表示编码，节点包含概率信息、节点类型以及子节点信息。由于Huffman码为变长码，采用指针存储码字序列，并记录比特位数。实验涵盖了从读入文件、构建码树、编码文件到解码文件的完整流程。

摘要由CSDN通过智能技术生成

一、实验原理
哈夫曼编码(Huffman Coding)，又称霍夫曼编码或最佳码，是可变字长编码(VLC)的一种，属于无损压缩。该方法完全依据字符出现概率来构造码字，出现概率大的符号码长短，概率小的码长大，能有效的减小码长，对于概率分布相差大的信源压缩效率高，而对于接近于等概分布的信源压缩效率低。

实际实现中常用二叉树来表示编码过程，节点需要表示的信息有它的概率；它是否为叶子节点，不是则表示是一个中间节点，它有左右子节点，是叶子结点则有一个符号；它的父节点用于建立码树。由于huffman码为变长码，不能事先预留空间，所以用指针来表示它的码字序列，还需指出它所用的比特位数，为了后续输出码表还添加了概率。

每个节点的数据结构为：

typedef struct huffman_node_tag
{
    unsigned char isLeaf;//是否为叶子结点
    unsigned long count;//该符号的个数
    struct huffman_node_tag *parent;//指向父节点的指针

    union
    {
        struct
        {
            struct huffman_node_tag *zero, *one;//子节点
        };
        unsigned char symbol;//符号
    };
} huffman_node;

每个码字的数据结构为：

typedef struct huffman_code_tag
{
    //add by zhn
    int count;//出现频率
    //end add
    /* The length of this code in bits. */
    unsigned long numbits;//比特位数
    unsigned char *bits;//比特流
} huffman_code;

编码步骤
1)统计个符号出现的次数，按照它们出现的概率并从大到小依次排列。
2)每次取概率最小的两个节点，合并概率，生成父节点，用父节点代替这两个子节点重新排序，直到根结点。
3)分配码字，二叉树的左节点为0，右节点为1，从根到叶子结点遍历得到码字。

二.实验步骤

1.Huffman编码流程

①读入文件

char memory = 0;//memory为1表示对内存编码
	char compress = 1;//compress为1表示压缩，为0是解压
	int

最低0.47元/天解锁文章

ininw

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录