算法导论程序39--最优二叉搜索树（Python）

最新推荐文章于 2025-04-04 11:24:32 发布

夜空霓虹

最新推荐文章于 2025-04-04 11:24:32 发布

阅读量3.8k

点赞数 4

分类专栏：算法

本文链接：https://blog.csdn.net/zhang_xiaomeng/article/details/72820147

版权

算法专栏收录该内容

41 篇文章

订阅专栏

本文介绍如何使用动态规划方法构建最优二叉搜索树。针对一组关键字及其搜索频率，通过递归算法找到期望搜索代价最小的二叉搜索树。文章详细展示了算法实现过程及示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最优二叉搜索树：

给定一个n个不同关键字的已排序的序列K=<k1,k2,...,kn>（因此k1<k2<...<kn）我们希望用这些关键字构造一棵二叉树。对每个关键字ki,都有一个概率pi表示其搜索频率。

有些要搜索的值可能不在K中，因此，我们还有n+1个“伪关键字”d0,d1,d2,...,dn表示不在K中的值。d0表示所有小于k1的值，dn表示所有大于kn的值，对i=1,2,...,n-1伪关键字di表示所有在ki和k(i+1)之间的值。

对每个伪关键字di也都有一个概率qi表示对应的搜索频率。

假定一次搜索的代价等于访问的结点数，即此次搜索找到的结点在T中的深度再加1.那么在T中进行一次搜索的期望代价为：

对于一个给定的概率集合，我们希望构造一棵期望搜索代价最小的二叉搜索树，我们称之为最优二叉搜索树。

用动态规划方法求解此问题：

步骤1：最优二叉搜索树的结构：

考虑一棵二叉搜索树的任意子树，它必须包含连续关键字ki，...，kj（1<=i<=j<=n），而且其叶结点必然是伪关键字d(i-1),....,dj。

最优子结构：

如果一棵最优二叉搜索树T中有一棵包含关键字ki，...，kj（1<=i<=j<=n）的子树T‘，那么T'必然是包含关键字ki，...，kj和伪关键字d(i-1),....,dj的子问题的最优解。

步骤2：一个递归算法

root[i, j]保存根结点kr的下标r。

步骤3：计算最优二叉搜索树的期望搜索代价

def optimal_bst(p,q,n):
    e=[[0 for j in range(n+1)]for i in range(n+2)]
    w=[[0 for j in range(n+1)]for i in range(n+2)]
    root=[[0 for j in range(n+1)]for i in range(n+1)]
    for i in range(n+2):
        e[i][i-1]=q[i-1]
        w[i][i-1]=q[i-1]
    for l in range(1,n+1):
        for i in range(1,n-l+2):
            j=i+l-1
            e[i][j]=float("inf")
            w[i][j]=w[i][j-1]+p[j]+q[j]
            for r in range(i,j+1):
                t=e[i][r-1]+e[r+1][j]+w[i][j]
                if t<e[i][j]:
                    e[i][j]=t
                    root[i][j]=r
    return e,root

if __name__=="__main__":
    p=[0,0.15,0.1,0.05,0.1,0.2]
    q=[0.05,0.1,0.05,0.05,0.05,0.1]
    e,root=optimal_bst(p,q,5)
    for i in range(5+2):
        for j in range(5+1):
            print(e[i][j]," ",end='')
        print()
    for i in range(5+1):
        for j in range(5+1):
            print(root[i][j]," ",end='')
        print()

运行：

>>> 
== RESTART: D:\Program Files\Python\test\algorithms\算法导论\39-optimal-bst.py ==
0  0  0  0  0  0.1  
0.05  0.45000000000000007  0.9  1.25  1.75  2.75  
0  0.1  0.4  0.7  1.2  2.0  
0  0  0.05  0.25  0.6  1.2999999999999998  
0  0  0  0.05  0.30000000000000004  0.9  
0  0  0  0  0.05  0.5  
0  0  0  0  0  0.1  
0  0  0  0  0  0  
0  1  1  2  2  2  
0  0  2  2  2  4  
0  0  0  3  4  5  
0  0  0  0  4  5  
0  0  0  0  0  5  
>>>