问题描述(详见算法导论P212-P213)
对于给定关键字序列,构造一颗最优的二叉查找树T,使得在T内的一次搜索的期望代价最小
前提概念
- 一颗最优二叉树不一定是一颗整体高度最小的树;也不一定总把具有最大概率的关键字作为根节点
- 二叉查找树的子树必定包含连续范围内的关键字
- 当一颗树成为一个节点的子树时,它的期望代价增加值为该树中所有概率的总和
最优子结构
设包含有序关键字(ki, ..., kj)的最优二叉查找树以kr(i≤r≤j)为根节点,则其左子树(ki, ..., kr-1)和右子树(kr+1, ..., kj)也同样为最优二叉查找树
递归表达式
作如下定义
- 给定一个由n个互异关键字(k1, ..., kn)组成的序列K,且关键字有序(k1<...<kn)。对每个关键字ki,一次搜索为ki的概率是pi。某些搜索值可能不在K内,因此还有n+1个”虚拟键“d0, d1, ..., dn代表不在K内的值,且ki≤di≤ki+1,di概率为qi
- e[i, j]:最优二叉查找树(ki, ..., kj)的期望代价
- w[i, j]:最优二叉查找树(ki, ..., kj)的概率总和,即∑p+∑q(p:i~j q:i-1~j)
- root[i, j]:记录最优二叉查找树(ki, ..., kj)的根节点的序号,用于构造问题最优解
- 当j=i-1时,表示只有虚拟键di-1,此时e[i, i-1] = w[i, i-1] = qi
递归表达式如下(推导过程见算法导论P214-P215)
自底向上的求解
求解过程类似于矩阵链乘法问题
构造最优解
根据矩阵ROOT中记录的值进行构造
代码
void dp(double * p, double * q, int n){
double ** e, ** w;
int ** rr;
e = (double **)malloc((n+2)*sizeof(double *)); //e下标取范为1~n+1和0~n,是为了保存e[n+1,n]和e[1,0]
w = (double **)malloc((n+2)*sizeof(double *));
rr = (int **)malloc((n+2)*sizeof(int *));
for(int i = 0; i <= n+1; i++){
e[i] = (double *)malloc((n+1)*sizeof(double));
w[i] = (double *)malloc((n+1)*sizeof(double));
rr[i] = (int *)malloc((n+1)*sizeof(int));
}
for(int i = 1; i <= n+1; i++){ //初始化
e[i][i-1] = q[i-1];
w[i][i-1] = q[i-1];
}
for(int l = 1; l <= n; l++){ //下标i从1开始,便于理解
for(int i = 1; i <= n-l+1; i++){
int j = i+l-1;
e[i][j] = DBL_MAX;
w[i][j] = w[i][j-1]+p[j]+q[j];
for(int r = i; r <= j; r++){
double t = e[i][r-1]+e[r+1][j]+w[i][j];
if(t < e[i][j]){
e[i][j] = t;
rr[i][j] = r;
}
}
}
}
printf("e: %lf\n", e[1][n]);
}