哈夫曼树
定义设有实数集,T是一棵扩充二叉树,其m个外部结点分别以wi(i=1,2,..,n-1)为权,而且T的带权外部路径长度在所有这样的扩充二叉树中达到最小,则称T为数据集的最优二叉树或者哈夫曼树。
哈夫曼算法
以下以一个例子演示了哈夫曼算法的过程。
由于构造哈夫曼树的过程中每次要取根节点较小的 两棵树生成重新一棵树,因此可以考虑使用优先队列存储这些待处理的树。
因为优先队列入队时会根据入队元素的大小将其放在合适的位置,使其元素始终是从小到大排列的。
以下是python实现哈夫曼算法的代码:
#二叉树节点类
class BinTNode:
def __init__(self,dat,left=None,right=None):
self.data=dat
self.left=left
self.right=right
#哈夫曼树节点类
class HTNode(BinTNode):
def __lt__(self, other): #python类的内置方法,自定义”小于”的比较操作
return self.data<other.data
#哈夫曼优先队列
class HuffmanPrioQ(PrioQueue):
def number(self):
return len(self._elems) #返回队列中的元素个数
#哈夫曼算法
def HuffmanTree(weights):
trees=HuffmanPrioQ()
for w in weights:
trees.enqueue(HTNode(w))
while trees.number()>1:
t1=trees.dequeue()
t2=trees.dequeue()
x=t1.data+t2.data
trees.enqueue(HTNode(x,t1,t2))
return trees.dequeue()