哈夫曼树
哈夫曼树又称最优二叉树,是一种作用于哈夫曼编码的工具,哈夫曼编码是一种无损压缩编码方式,此种压缩方式可以让原始编码长度更短,从而更节省存储空间和传输带宽。
哈夫曼树基本概念
树的路径长度
两个结点之间的连线称为路径(一般是根节点到叶子节点),路径长度其实就是路径个数;
例:
结点15到结点2的路径长度是2;结点15到结点4的路径长度是3;
树的路径长度是根节点到每个叶子节点的路径长度之和
根节点15到叶子节点2的路径长度是2;根节点15到叶子节点4的路径长度是3;
根节点15到叶子节点8的路径长度是3;根节点15到叶子节点1的路径长度是1;
树的路径长度=2+3+3+1=8;
权
权是指叶子结点的数值(叶子节点的数值代表某一字符出现的频率)
例:
图中叶子节点红色数值。
带权路径长度
带权的路径长度就是本身的路径长度乘以结点的权值
例:
结点2的带权路径长度是根节点15到叶子结点2的路径长度乘以结点2的权值。即 2*2=4
结点4的带权路径长度是根节点15到叶子结点4的路径长度乘以结点4的权值。即 3*4=12
树的带权路径长度(树的代价)
树的带权路径长度是根节点到每个叶子结点的带权路径总和。
例:
结点2的带权路径长度是根节点15到叶子结点2的路径长度乘以结点2的权值。即 2*2=4
结点4的带权路径长度是根节点15到叶子结点4的路径长度乘以结点4的权值。即 3*4=12
结点8的带权路径长度是根节点15到叶子结点8的路径长度乘以结点8的权值。即 3*8=24
结点1的带权路径长度是根节点15到叶子结点1的路径长度乘以结点1的权值。即 1*1=1
树的带权路径长度(树的代价)=4+12+24+1=41
中间结点
其实哈夫曼树中真正的权值只有叶子结点,其他的中间结点都是构造的。
构造哈夫曼树的思想理念
同一组权值,不同的构造方式得到的树的带权路径长度也是不同的。
构造哈夫曼树的思想理念是树的带权路径越短越好,目标是构造树的带权路径最短的哈夫曼树。
例:
由权值 2、4、8、1 构造而成的哈夫曼树
构造方法一中树的带权路径长度是:2*2+3*4+3*8+1+1=41。
构造方法二中树的带权路径长度是:2*4+3*1+2*3+1*8=25。
根据权值构建树的带权路径最短的哈夫曼树
例题:
有一组权值:5、29、7、8、14、23、3、11,尝试构造哈夫曼树。
树的带权路径长度
结点3的带权路径长度是根节点100到叶子结点3的路径长度乘以结点3的权值。即5*3=15。
结点5的带权路径长度是根节点100到叶子结点5的路径长度乘以结点5的权值。即5*5=25。
结点7的带权路径长度是根节点100到叶子结点7的路径长度乘以结点7的权值。即4*7=28。
结点14的带权路径长度是根节点100到叶子结点14的路径长度乘以结点14的权值。即3*14=42
结点29的带权路径长度是根节点100到叶子结点29的路径长度乘以结点29的权值。即2*29=58
结点8的带权路径长度是根节点100到叶子结点8的路径长度乘以结点8的权值。即3*8=24。
结点11的带权路径长度是根节点100到叶子结点11的路径长度乘以结点11的权值。即3*11=15
结点23的带权路径长度是根节点100到叶子结点23的路径长度乘以结点23的权值。即2*23=46
树的带权路径长度=15+25+28+42+58+24+15+46=253。