我们可以知道,Huffman编码的初衷是为了减小文件体积,使得相同的内容通过重写字符集用更小的内存来保存数据。
阅读本文章之前,默认读者已经对Huffman编码有了基本的了解!!!
首先我们需要回答两个问题,如何判断叶子节点与根节点权相等时的等价条件,以及为什么要判断或者证明叶子节点与根节点权相等时的数学等价。
如何判断叶子节点与根节点权相等时的等价条件:我们上面说过,Huffman编码是为了减少存储空间而存在的一种重写字符集的算法,那么,如果两个节点等价,两个节点交换时,所组成的字符集编码使得原数据大小保持不变。
为什么要判断或者证明叶子节点与根节点权相等时的数学等价:Huffman编码的基础构建模式就是将两个权最小的节点组成一个新的节点,并将这个新节点放入到原数组当中当作一个新的节点参与树的构建,他的权则是两个子节点的权相加,这是一个贪心算法的过程,通过局部最优解来达到全局最优解。很多人会很自然的略过这一问题,但是我觉得这才是Huffman编码最精妙的一部分,即:叶子节点与根节点的等价性。
如图,我们假设灰色填充的节点为叶子节点,白色填充的为根节点(证明过程非常简单,但重要的不是证明过程,而是发出证明的想法,以及发现Huffman编码的精妙)。
设白15的深度为X,权为N则在如图所示结构的情况下,编码长度为
(x+1)*n+(x-1)*n = nx+n+nx-n = 2nx;
如果将白15与黑15的位置对调,则
编码长度为
x*n+x*n = 2nx;
证明完毕,在权相等的情况下,根节点与叶子节点等价。