最优二叉搜索树:
给定一个n个不同关键字的已排序的序列K=<k1,k2,...,kn>(因此k1<k2<...<kn)我们希望用这些关键字构造一棵二叉树。对每个关键字ki,都有一个概率pi表示其搜索频率。
有些要搜索的值可能不在K中,因此,我们还有n+1个“伪关键字”d0,d1,d2,...,dn表示不在K中的值。d0表示所有小于k1的值,dn表示所有大于kn的值,对i=1,2,...,n-1伪关键字di表示所有在ki和k(i+1)之间的值。
对每个伪关键字di也都有一个概率qi表示对应的搜索频率。
假定一次搜索的代价等于访问的结点数,即此次搜索找到的结点在T中的深度再加1.那么在T中进行一次搜索的期望代价为:
对于一个给定的概率集合,我们希望构造一棵期望搜索代价最小的二叉搜索树,我们称之为最优二叉搜索树。
用动态规划方法求解此问题:
步骤1:最优二叉搜索树的结构:
考虑一棵二叉搜索树的任意子树,它必须包含连续关键字ki,...,kj(1<=i<=j<=n),而且其叶结点必然是伪关键字d(i-1),....,dj。
最优子结构:
如果一棵最优二叉搜索树T中有一棵包含关键字ki,...,kj(1<=i<=j<=n)的子树T‘,那么T'必然是包含关键字ki,...,kj和伪关键字d(i-1),....,dj的子问题的最优解。
步骤2:一个递归算法
root[i, j]保存根结点kr的下标r。
步骤3:计算最优二叉搜索树的期望搜索代价
def optimal_bst(p,q,n):
e=[[0 for j in range(n+1)]for i in range(n+2)]
w=[[0 for j in range(n+1)]for i in range(n+2)]
root=[[0 for j in range(n+1)]for i in range(n+1)]
for i in range(n+2):
e[i][i-1]=q[i-1]
w[i][i-1]=q[i-1]
for l in range(1,n+1):
for i in range(1,n-l+2):
j=i+l-1
e[i][j]=float("inf")
w[i][j]=w[i][j-1]+p[j]+q[j]
for r in range(i,j+1):
t=e[i][r-1]+e[r+1][j]+w[i][j]
if t<e[i][j]:
e[i][j]=t
root[i][j]=r
return e,root
if __name__=="__main__":
p=[0,0.15,0.1,0.05,0.1,0.2]
q=[0.05,0.1,0.05,0.05,0.05,0.1]
e,root=optimal_bst(p,q,5)
for i in range(5+2):
for j in range(5+1):
print(e[i][j]," ",end='')
print()
for i in range(5+1):
for j in range(5+1):
print(root[i][j]," ",end='')
print()
运行:
>>>
== RESTART: D:\Program Files\Python\test\algorithms\算法导论\39-optimal-bst.py ==
0 0 0 0 0 0.1
0.05 0.45000000000000007 0.9 1.25 1.75 2.75
0 0.1 0.4 0.7 1.2 2.0
0 0 0.05 0.25 0.6 1.2999999999999998
0 0 0 0.05 0.30000000000000004 0.9
0 0 0 0 0.05 0.5
0 0 0 0 0 0.1
0 0 0 0 0 0
0 1 1 2 2 2
0 0 2 2 2 4
0 0 0 3 4 5
0 0 0 0 4 5
0 0 0 0 0 5
>>>