最优二叉查找树详解(算法导论学习笔记)

62 篇文章 2 订阅
46 篇文章 1 订阅

代码均未经过严格测试,仅供参考

最优二叉查找树

动态规划原理

动态规划与分治法相似,都是通过组合子问题的解来求解原问题。

动态规划通常是用来求解最优化问题(optimization problem).这类问题可以有很多个可行解,每个解都有一个值,我们希望寻找最优值(最大值或者最小值)的解。我们称这样的解为问题的一个最优解(oneoptimization solution)而不是最优解(theoptimization solution),因为可能有多个解都达到最优值。

通常按照如下四个步骤来设计一个动态规划算法:

  1. 刻画一个最优解的结构特征;
  2. 递归地定义最优解的值;
  3. 计算最优解的值,通常采用自底向上的方法;
  4. 利用计算出的线性构造一个最优解。

基本概念

  • 平均查找长度ASL——查找方法时效的度量:为确定记录在查找表中的位置,需将关键字和给定值比较次数的期望值。

  • 查找成功时的ASL计算方法:ASL= ni=0PiCi

    n:记录的个数
    pi:查找第i个记录的概率
    ( 不特别声明时认为等概率 pi =1/n )
    ci:找到第i个记录所需的比较次数
    约定:无特殊说明,一般默认关键字的类型为整型

  • ASLs:(查找成功的的平均查找长度)

  • ASLf:(查找失败的平均查找长度)

关于静态最优查找树

定义:查找性能最佳的判定树。

性质:带权内路径长度之和PH为最小值。

PH=ni=1(WiHi) 与ASLs成正比
其中n:二叉树上结点的个数(有序表长度)
Hi:第i个结点在二叉树上的层次数
Wi=c*pi:c为某个常量;
pi:第i个结点的查找概率

问题描述

给定n个不同关键字的已经排序的序列 k1,k2,k3...kn 我们希望用这些关键字构造一颗二叉搜索树,对每个关键字都有一个概率p表示其搜索频率。有些要搜索的值可能不在K中,因此我们还有n+1个”伪关键字” d0,d1,d2...dn 其中 d0 表示所有小于 k1 的值, dn 表示所有大于 kn 的值,对于 i=1,2,3,4...n1,dikiki+1 。对每个伪关键字 di 也都一个概率 qi 表示对应的搜索频率。每个关键字 ki 是一个内部节点,每一个关键字 di 表示一个叶节点。有 ni=1pi+ni1qi=1

最优查找体现的原则:

1)最先访问的结点应是访问概率最大的结点;
2)每次访问应使结点两边尚未访问的结点的被访概率之和尽可能相等。

关于次优查找树

PH值近似为最小
比静态最优查找树易于构造,时间开销少

首先按照权值升序排列,每一次选择一个,右边所有节点权值相加和减去左边节点权值相加和 最小的节点作为根节点,然后以左边节点作为左子树,右边节点作为右子树,分别构造其次优查找树。

复杂度分析以及可能的优化

很显然由于需要枚举区间长度,区间端点以及根节点。所以算法复杂度为 O(n3)

递推式的形式为 dp[i][j]=min(dp[i][r1]+dp[r+1][j]+sum[i][j])

可以考虑用四边形不等式优化。

算法实现

次优查找树的实现非常简单,一个数组存储每个节点的权值。计算前缀和,找到差值最大的点作为根节点后。递归构造左子树和右子树的次优查找树。

我们来尝试使用动态规划算法构造最优查找树

double p[MAXN];//用来记录每一个节点的查找概率
double q[MAXN];//用来记录伪关键字的搜索概率
double dp[MAXN][MAXN];//dp[i][j]表示从节点i到节点j构成的最优查找树的PH值的最小值
int root[MAXN][MAXN];//root[i][j]表示从节点i到节点j构成的最优查找树的根节点
double sum[MAXN][MAXN];//sum[i][j]表示区间i到j的的区间概率和

//伪代码如下
for(int 子树大小 len=1;len<=n;len++){
    for(int 子树起点 i=1;i<n-len+1;i++){
        int 子树的终点则为j=i+len-1
        然后试图用每个节点作为根节点,找到使得总代价最小的一个
        总代价为左右子树的代价相加+区间的概率和。因为每一个节点都往下移了一层
        for(int r=i;r<=j;r++){
            dp[i][j]=min(dp[i][r-1]+dp[r+1][j]+sum[i][j]);
            并更新对应的根节点的值
        }
    }
}

记录了每个区间的PH值和根节点之后,再递归还原出整课最优查找树即可。

代码如下:

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cmath>
#include <cstring>
#include <string>
#include <vector>
#include <map>
#include <set>
using namespace std;

#define _ sync_with_stdio(false)
typedef long long ll;
const int MAXN=1000+10;
const double INF=1e9+7;


int n;//节点总个数
double p[MAXN];//用来记录每一个节点的查找概率
double q[MAXN];//用来记录伪关键字的搜索概率
double dp[MAXN][MAXN];//dp[i][j]表示从节点i到节点j构成的最优查找树的PH值的最小值
int root[MAXN][MAXN];//root[i][j]表示从节点i到节点j构成的最优查找树的根节点
double sum[MAXN][MAXN];//sum[i][j]表示区间i到j的的区间概率和

void solve(){
    for(int len=1;len<=n;len++){
        for(int i=1;i<=n-len+1;i++){
            int j=i+len-1;
            dp[i][j]=INF;
            for(int r=i;r<=j;r++){
                double temp;
                temp=dp[i][r-1]+dp[r+1][j]+sum[i][j];
                if(temp<dp[i][j]){
                    root[i][j]=r;
                    dp[i][j]=temp;
                }
            }
        }
    }
}

void init(){
    for(int i=1;i<=n;i++){
        for(int j=0;j<=n;j++){
            if(j==i-1){
                sum[i][j]=q[i-1];
                dp[i][j]=q[i-1];
            }
            else if(j>=i){
                sum[i][j]=sum[i][j-1]+p[j]+q[j];
                if(i==j){
                    //dp[i][j]=p[i]+q[i-1]+q[i];
                    root[i][j]=i;
                }
                dp[i][j]=0;
            }else{
                sum[i][j]=0;
                dp[i][j]=0;
            }
        }
    }
    sum[n+1][n]=dp[n+1][n]=q[n];

}

void dfs(int l,int r){
    if(l>r){
        cout<<"{}";
        return;
    }
    cout<<root[l][r];
    int Root=root[l][r];
    cout<<"{";
    dfs(l,Root-1);
    cout<<",";
    dfs(Root+1,r);
    cout<<"}";
    return;
}

int main(){
    freopen("in.txt", "r", stdin);
    cout<<"请输入待查找关键字的数量:"<<endl;
    cin>>n;
    cout<<"请输入"<<n<<"个待查找关键字的搜索频率:"<<endl;
    for(int i=1;i<=n;i++){
        cin>>p[i];
    }
    cout<<"请输入"<<n+1<<"个伪关键字的搜索频率:"<<endl;
    for(int i=0;i<=n;i++){
        cin>>q[i];
    }
    init();
    solve();
    cout<<"最小PH值为:"<<dp[1][n]<<endl<<"最优查找树构造如下:"<<endl;
    dfs(1,n);
    return 0;
}
  • 4
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
以下是最搜索的C++代码,附有注释和使用vector实现: ```c++ #include <iostream> #include <vector> #include <limits.h> //包含INT_MAX using namespace std; //计算最搜索 void optimal_bst(vector<int> keys, vector<int> freq) { int n = keys.size(); //关键字数量 vector<vector<int>> cost(n+1, vector<int>(n+1)); //存放最小代价 vector<vector<int>> root(n, vector<int>(n)); //存放最小代价的根节点 for (int i = 0; i < n; i++) { cost[i][i] = freq[i]; //初始化对角线上的值 root[i][i] = i; //初始化对角线上的根节点 } for (int len = 2; len <= n; len++) { //计算长度为2到n的子 for (int i = 0; i <= n-len; i++) { int j = i + len - 1; //子的右端点 cost[i][j] = INT_MAX; //初始化最小代价为最大值 for (int k = i; k <= j; k++) { int left_cost = (k > i) ? cost[i][k-1] : 0; int right_cost = (k < j) ? cost[k+1][j] : 0; int sum_freq = 0; //计算i到j关键字的总频率 for (int m = i; m <= j; m++) { sum_freq += freq[m]; } int total_cost = left_cost + right_cost + sum_freq; //当前代价 if (total_cost < cost[i][j]) { //更新最小代价和根节点 cost[i][j] = total_cost; root[i][j] = k; } } } } cout << "最小代价为:" << cost[0][n-1] << endl; } int main() { vector<int> keys = {10, 12, 16, 21}; //关键字 vector<int> freq = {4, 2, 6, 3}; //频率 optimal_bst(keys, freq); return 0; } ``` 注释详解: 1. `optimal_bst`函数用于计算最搜索。参数包括关键字`keys`和频率`freq`,分别存放关键字和对应的频率。 2. `cost`和`root`分别是两个二维向量,用于存放最小代价和对应的根节点。 3. 初始化`cost`和`root`的对角线。 4. 计算长度为2到n的子,从左到右,从上到下依次计算每个子的最小代价。 5. `k`遍历`i`到`j`之间的关键字,计算左子和右子的最小代价,以及当前子的总频率。 6. 如果当前代价小于最小代价,则更新最小代价和对应的根节点。 7. `main`函数中定义了测试数据,调用`optimal_bst`函数并输出结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值