如果使用不定长编码容易产生歧义,压缩率容易上升,从而出现乱码等.
如何解决!!!
下面我们根据哈夫曼树来看一下:
路径和路径长度:在一颗树中,从一个节点往下可以到达的孩子或孙子节点之间的通路,称之为路径
通路当中分支的数目称为路径的长度
若规定根节点的层数为1,则从根节点到第L层节点的长度为L-1
节点的权:若树中节点赋给一个有着某种意义的数值,则这个数值称为这个节点的权。
带权路径长度:从根节点到该节点之间的路径长度与该节点的权的乘积
树的权路径长度:树的带权路径长度为所有叶子节点的带权路径长度之和,记为WPL,权值越大的节点离跟节点越近的二叉树是最优二叉树
得出压缩率为(80-30)/80 = 62.5%