原理介绍:
二叉搜索树(Binary Search Tree, BST)是一种常见的数据结构。具有以下特点:
①结点的左子树中的每个结点的元素均小于该结点的元素。
②结点的右子树中的每个结点的元素均大于该结点的元素。
③左子树和右子树也分别为二叉搜索树。
设二叉搜索树T是由有序集S={x1,x2,...,xn}构成的,则在T中搜索一个元素x返回的结果有两种情况:(1) 找到x=xi (2)找不到x,但可以确定x的范围(xi,xi+1) 特别令
,
设在第(1)情况中找到x=xi的概率为,在第(2)种情况中确定x
(xi,xi+1)的概率为
。显然有
则 (a0,b1,a1,...,bn,an)称为集合S的存取概率分布,记作P(1,n)。
平均比较次数:
其中ci为xi的深度,dj为叶子结点(xj,xj+1)的深度。
问题描述:
最优二叉搜索树问题是对于有序集S及其概率分布(a0,b1,a1,...,bn,an),在所有表示有序集S的二叉搜索树中找出一棵具有最小平均路长的二叉搜索树。
动态规划思路:
(一)最优子结构性质
1、子问题划分
对于有序集S={x1,x2,...,xn},可选取一个子数据集S(i,j)={xi,xi+1,...,xj},其存取概率分布为P(i,j)=(ai-1,bi,ai,...,bj,aj)
以Xk作为根结点即可将原问题划分为两个子问题:
2、递归计算最优值
算法代码:
#include <iostream>
using namespace std;
const int MaxVal = 9999;
const int n = 5;
//搜索到根节点和虚拟键的概率
double p[n + 1] = {-1,0.15,0.1,0.05,0.1,0.2};
double q[n + 1] = {0.05,0.1,0.05,0.05,0.05,0.1};
int root[n + 1][n + 1];//记录根节点
double w[n + 2][n + 2];//子树概率总和
double e[n + 2][n + 2];//子树期望代价
void optimalBST(double *p,double *q,int n)
{
//初始化只包括虚拟键的子树
for (int i = 1;i <= n + 1;++i)
{
w[i][i - 1] = q[i - 1];
e[i][i - 1] = q[i - 1];
}
//由下到上,由左到右逐步计算
for (int len = 1;len <= n;++len)
{
for (int i = 1;i <= n - len + 1;++i)
{
int j = i + len - 1;
e[i][j] = MaxVal;
w[i][j] = w[i][j - 1] + p[j] + q[j];
//求取最小代价的子树的根
for (int k = i;k <= j;++k)
{
double temp = e[i][k - 1] + e[k + 1][j] + w[i][j];
if (temp < e[i][j])
{
e[i][j] = temp;
root[i][j] = k;
}
}
}
}
}
//输出最优二叉查找树所有子树的根
void printRoot()
{
cout << "各子树的根:" << endl;
for (int i = 1;i <= n;++i)
{
for (int j = 1;j <= n;++j)
{
cout << root[i][j] << " ";
}
cout << endl;
}
cout << endl;
}
//打印最优二叉查找树的结构
//打印出[i,j]子树,它是根r的左子树和右子树
void printOptimalBST(int i,int j,int r)
{
int rootChild = root[i][j];//子树根节点
if (rootChild == root[1][n])
{
//输出整棵树的根
cout << "k" << rootChild << "是根" << endl;
printOptimalBST(i,rootChild - 1,rootChild);
printOptimalBST(rootChild + 1,j,rootChild);
return;
}
if (j < i - 1)
{
return;
}
else if (j == i - 1)//遇到虚拟键
{
if (j < r)
{
cout << "d" << j << "是" << "k" << r << "的左孩子" << endl;
}
else
cout << "d" << j << "是" << "k" << r << "的右孩子" << endl;
return;
}
else//遇到内部结点
{
if (rootChild < r)
{
cout << "k" << rootChild << "是" << "k" << r << "的左孩子" << endl;
}
else
cout << "k" << rootChild << "是" << "k" << r << "的右孩子" << endl;
}
printOptimalBST(i,rootChild - 1,rootChild);
printOptimalBST(rootChild + 1,j,rootChild);
}
int main()
{
optimalBST(p,q,n);
printRoot();
cout << "最优二叉树结构:" << endl;
printOptimalBST(1,n,-1);
}