哈夫曼树及哈夫曼编码

一、哈夫曼树

    哈夫曼树,又称最优二叉树,是一类带权路径长度最短的树。

    叶子结点的权值:对叶子结点赋予一个有意义的数量值。

    二叉树的带权路径长度:设二叉树有n个带权值的叶子结点,从根结点到各个叶子结点的路径长度与相应叶子结点权值的乘积之和。

    哈夫曼树:给定一组具有确定权值的叶子结点,带权路径长度最小的二叉树。

    例如,给定4个叶子结点,其权值分别是2,3,4,7,可以构造出形状不同的多个二叉树:



     如图所示,第一棵二叉树WPL=2*2+3*2+4*2+7*2=32;第二棵二叉树WPL=2*1+3*2+4*3+7*3=41;第三棵二叉树WPL=7*1+4*2+2*3+3*3=30。


     由此可知哈夫曼树的特点:

   (1)权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。

   (2)只有度为0和度为2的结点,不存在度为1的结点。


     哈夫曼算法的基本思想:

    (1)初始化:由给定的n个权值w1,w2,w3...wn构造n棵只有一个根结点的二叉树,从而得到一个二叉树集合F={T1,T2,T3...Tn};

    (2)选取与合并:在F中选取根结点的权值最小的两棵二叉树分别作为左右子树构造一棵新的二叉树,这棵新二叉树的根结点的权值为其左右子树根结点的权值之和;

    (3)删除与加入:在F中删除作为左右子树的两棵二叉树,并将新建立的二叉树加入到F中;

    (4)重复(2)、(3)两步,当集合F中只剩下一棵二叉树时,这棵二叉树便是哈夫曼树。


     由上述基本思想可知,具有n个叶子结点的哈夫曼树共有2n-1个结点,其中n-1个是非叶子结点。


二、哈夫曼树的存储结构

     考虑到哈夫曼树有2n-1个结点,并且进行n-1次合并操作,为了便于选取根结点权值最小的二叉树以及合并操作,设置一个向量容器hufftree保存哈夫曼树中各结点的信息。向量中各元素的结点结构为:


     其中,weight为结点的权值,lchild为结点的左孩子结点在向量中的位置,rchild为结点的右孩子结点在向量中的位置,parent为结点的双亲在向量的位置。用C++结构体定义上述结点:

struct element{
	char data;
	int weight;
	int lchild, rchild, parent;
};

     为了判定一个结点是否已经加入到哈夫曼树中,可以通过parent的值来确定。初始化时parent的值为-1,当某个结点加入到树中时,该结点的parent的值为其双亲结点在向量中的位置。

     哈夫曼算法:

     1.向量hufftree初始化,向量中各元素的双亲、左右孩子都置为-1;

     2.向量hufftree的前n个元素的权值置为给定叶子结点权值;

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值