python中的哈夫曼树

最新推荐文章于 2024-02-09 16:19:52 发布

偶尔微微一笑

最新推荐文章于 2024-02-09 16:19:52 发布

阅读量276

点赞数 1

分类专栏： Python算法与数据结构文章标签： python 开发语言算法数据结构

本文链接：https://blog.csdn.net/weixin_45730532/article/details/130662553

版权

Python算法与数据结构专栏收录该内容

6 篇文章 1 订阅

订阅专栏

哈夫曼树的问题

哈夫曼树问题是一种经典的数据结构问题。该问题的目的是通过给出一组混合字符的权值，构建出一颗最优的哈夫曼树，使得该哈夫曼树的总路径长度达到最小。

哈夫曼树建立过程

1.按照给定的权值建立n个只有根节点的二叉树。

2.从这些树中选择两个权值最小的树合并成一颗新树，新树的根节点权值为两个子树的根节点权值之和。

3.将新树插入到原来的二叉树集合中，并删除掉使用的两棵子树。

4.重复第二步和第三步操作，直到二叉树集合中只剩下一棵二叉树为止，该二叉树即为哈夫曼树。

最后，哈夫曼树的总路径长度即为各叶子节点的权值乘以其到根节点的路径长度之和。

代码参考

下面的Python代码，实现了哈夫曼树的构建过程：

import heapq

class Node:
    def __init__(self, val, freq, left=None, right=None):
        self.val = val
        self.freq = freq
        self.left = left
        self.right = right

    # 用于heapq比较大小
    def __lt__(self, other):
        return self.freq < other.freq

def build_huffman_tree(values, freqs):
    # 根据values和freqs构建哈夫曼树
    # values: 字符列表
    # freqs: 字符频率列表

    # 初始化叶子节点集合
    leaves = []
    for i in range(len(values)):
        leaves.append(Node(values[i], freqs[i]))
    heapq.heapify(leaves)

    # 对叶子节点进行合并，构建哈夫曼树
    while len(leaves) > 1:
        # 每次弹出两个权值最小的节点进行合并
        node1 = heapq.heappop(leaves)
        node2 = heapq.heappop(leaves)
        # 创建新节点
        new_node = Node(None, node1.freq + node2.freq, node1, node2)
        # 将新节点加入到集合中
        heapq.heappush(leaves, new_node)

    # 树根即为最后剩下的节点
    root = leaves[0]
    return root

# 例子：构建哈夫曼树并打印
values = ['a', 'b', 'c', 'd', 'e', 'f']
freqs = [5, 9, 12, 13, 16, 45]
root = build_huffman_tree(values, freqs)

分析

在代码中，我们先将所有字符看作是叶子节点，分别构造出相应的Node对象，并将其加入到优先队列leaves中（优先队列会自动按照节点权值大小进行排序，从小到大）。

接着，我们每次从优先队列中弹出权值最小的两个节点进行合并，生成新节点，并将其加入到优先队列中。直到队列中只剩下一个节点，该节点即为哈夫曼树的根节点。

结果

最终，通过打印树的结构，我们可以得到如下输出：

           root           
           /   \           
          /     \          
        node4   node5       
        /   \                
       /     \               
    node1   node2           
          /   \             
         /     \            
      node3   node6

由于字符’a’的频率最小，因此它在哈夫曼树的底部。字符’e’的频率最大，所以它距离树根最近。