哈夫曼树:
树的带权路径长度是树中所有叶子结点的带权路径长度之和。一组具有确定权值的叶结点可以构成多个带权二叉树。带权路径长度最小的二叉树就称作最优二叉树,或者哈夫曼树。通过实践可以发现,哈夫曼树总是把权值大的叶结点放在靠近根结点的地方,权值小的结点放在深度大的地方。哈夫曼算法给出了构造哈夫曼树的基本思想:
1.给出n个权值各异的结点作为n颗二叉树的根结点,左右子树均空,组成二叉树集合F;
2.在F中找出两颗权值最小的树作为左右子树构成一颗新树,新树的根结点的权值是左右子树根结点的权值之和;
3.在F中删除刚刚选出的左右子树,把新树放进F;
4.重复2.3剩下的那颗树就是要求的哈夫曼树。
哈夫曼编码:
在数据通信中需要把电文字符转化成0,1(编码),在接收端需要将二进制码转化成对应的字符串(译码)。在发送电文时需要在保证正确的情况下让代码尽可能的短,这就要求原字符串中出现次数较多的字符的转化码要短,同时一段二进制码不能有二义性,即不能有多种翻译方式,这又要求任意字符的编码不能是另一个字符编码的前缀。我们把字符出现的次数看做权值,把所有的字符都放在叶子结点上,这样就解决了上述的两个问题。于是焦点就集中在了哈夫曼树上。这样的编码称为哈夫曼编码。
树的带权路径长度是树中所有叶子结点的带权路径长度之和。一组具有确定权值的叶结点可以构成多个带权二叉树。带权路径长度最小的二叉树就称作最优二叉树,或者哈夫曼树。通过实践可以发现,哈夫曼树总是把权值大的叶结点放在靠近根结点的地方,权值小的结点放在深度大的地方。哈夫曼算法给出了构造哈夫曼树的基本思想:
1.给出n个权值各异的结点作为n颗二叉树的根结点,左右子树均空,组成二叉树集合F;
2.在F中找出两颗权值最小的树作为左右子树构成一颗新树,新树的根结点的权值是左右子树根结点的权值之和;
3.在F中删除刚刚选出的左右子树,把新树放进F;
4.重复2.3剩下的那颗树就是要求的哈夫曼树。
哈夫曼编码:
在数据通信中需要把电文字符转化成0,1(编码),在接收端需要将二进制码转化成对应的字符串(译码)。在发送电文时需要在保证正确的情况下让代码尽可能的短,这就要求原字符串中出现次数较多的字符的转化码要短,同时一段二进制码不能有二义性,即不能有多种翻译方式,这又要求任意字符的编码不能是另一个字符编码的前缀。我们把字符出现的次数看做权值,把所有的字符都放在叶子结点上,这样就解决了上述的两个问题。于是焦点就集中在了哈夫曼树上。这样的编码称为哈夫曼编码。
初始森林中有n颗只有根结点的树,要合成哈夫曼树必要进行n-1次合并,n-1次合并也就产生了n-1个新的结点,这些新结点的度是2,所以哈夫曼树的总结点数是2n-1,哈夫曼树没有度为1的分支结点(严格的或正则的二叉树)。编码:从叶子结点出发走到根;译码:从根结点走到叶子结点。
例子:
输