一:
Huffman编码:
1)是一种无失真编码的编码方式,可变长编码的一种;
2)基于信源的概率统计模型,它的基本思路是,出现概率小的信源符号编长码,出现概率大的信源符号编短码,从而使平均码长最小。
3)在程序实现中常使用一种叫做树的数据结构实现Huffman编码,由它编出的是即时码。
Huffman编码算法:
1)将文件以ASCII字符流的形式读入,统计每个符号的发生频率;
2)将所有文件中出现过的字符按从小到大的顺序排列;
3)每一次选出最小的两个值,作为二叉树的两个叶子节点,将作为它们根节点,这两个叶子节点不再参与比较,新的根节点参与比较;
4)重复三,直到最后得到和为1的根节点;
5)将形成的二叉树左节点标0,右节点标1,把从最上面的根节点到最下面叶子点途中遇到的0、1序列串起来,得到了各个字符的编码表示。
Huffman编码流程:
读入待编码文件---