标签: 杂谈 |
来自:http://icymarywei.blog.163.com/blog/static/127508102200992110225395
1,问题描述:给定一个有序序列K={k1<k2<k3<,……,<kn}和他们被查询的概率P={p1,p2,p3,……,pn},要求构造一棵二叉查找树T,使得查询所有元素的总的代价最小。对于一个搜索树,当搜索的元素在树内时,表示搜索成功。当不在树内时,表示搜索失败,用一个“虚叶子节点”来标示搜索失败的情况,因此需要n+1个虚叶子节点{d0<d1<……<dn}。其中d0表示搜索元素小于k1的失败结果,dn表示搜索元素大于kn的失败情况。di(0<i<n)表示搜索节点在ki和k(i+1)之间时的失败情况。对于应di的概率序列是Q={q0,q1,……,qn}。
2,问题分析:
在二叉树中T内搜索一次的期望代价为:
E[T]=
3,问题求解:动态规划
步骤一:寻找最优子结构。
一个最优二叉树的子树必定包含连续范围的关键字ki~kj,1<=i<=j<=n,同时也必须含有连续的虚叶子节点di-1~dj。
如果一棵最优二叉查找树T有一棵含有关键字ki~kj的子树T',那么,T'也是一棵最优查找树,这通过剪贴思想可以证明。
现在开始构造最优子结构:在ki~kj中,选定一个r,i<=r<=j,使以kr为根,ki~k(r-1)和k(r+1)~kj为左右孩子的最优二叉树。注意r=i或者r=j的情况,表示左子树或右子树只有虚叶子节点。
步骤二:一个递归解。
定义e[i,j]为一棵包含关键字ki~kj的最优二叉树的期望代价。当j=i-1时没有真实的关键在,只有虚叶子节点d(i-1)。
于是:
当j=i-1时,e[i,i-1]=q(i-1)。
当j>=i时,需要选择合适的kr作为根节点,然后其余节点ki~K(r-1)和k(r+1)~kj构造左右孩子。这时要考虑左右孩子这些节点成为一个节点的子树后,它的搜索代价的变化:根据E[T]的计算,得知它们的期望代价增加了“子树中所有概率的总和”w。
w[i,j]=
于是当j>=i时,e[i,j]=pr + (e[i,r-1]+w[i,r-1])+(e[r+1,j]+w[r+1,j]) = e[i,r-1] + e[r+1,j]+w[i,j];
步骤三:计算最优二叉树的期望代价
e[i,j]=
w[i,j] =
实现代码如下:
view plaincopy to clipboardprint?
1 #include <iostream>
2 using namespace std;
3
4 #define MAXNUM 100
5 #define MAX 65536
6 //p中为有序关键字k1到k5的搜索概率,k1<k2<k3<k4<k5
7 double p[MAXNUM] = {0.00,0.15,0.10,0.05,0.10,0.20};
8 double q[MAXNUM] = {0.05,0.10,0.05,0.05,0.05,0.10};
9 void optimal_bst(double e[][MAXNUM],int root[][MAXNUM],double w[][MAXNUM],int n)
10 {
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41 }
42 int main()
43 {
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58 }