动态规划

用于解决多阶段决策中具有最优子结构且无后效性的问题。

最优子结构:最优化原理可这样阐述:一个最优化策略具有这样的性质,不论过去状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。

无后效性:将各阶段按照一定的次序排列好之后,对于某个给定的阶段状态,它以前各阶段的状态无法直接影响它未来的决策,而只能通过当前的这个状态。换句话说,每个状态都是过去历史的一个完整总结。这就是无后向性,又称为无后效性。

另外一个附加性质是子问题的重叠性: 动态规划将原来具有指数级时间复杂度的搜索算法改进成了具有多项式时间复杂度的算法。其中的关键在于解决冗余,这是动态规划算法的根本目的。动态规划实质上是一种以空间换时间的技术,它在实现的过程中,不得不存储产生过程中的各种状态,所以它的空间复杂度要大于其它的算法。

基本模型

(1)确定问题的决策对象。 (2)对决策过程划分阶段。 (3)对各阶段确定状态变量。 (4)根据状态变量确定费用函数和目标函数。 (5)建立各阶段状态变量的转移过程,确定状态转移方程。

基本思想
动态规划算法通常用于求解具有某种最优性质的问题。在这类问题中,可能会有许多可行解。每一个解都对应于一个值,我们希望找到具有最优值的解。动态规划算法与分治法类似,其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。与分治法不同的是,适合于用动态规划求解的问题,经分解得到子问题往往不是互相独立的。若用分治法来解这类问题,则分解得到的子问题数目太多,有些子问题被重复计算了很多次。如果我们能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,这样就可以避免大量的重复计算,节省时间。我们可以用一个表来记录所有已解的子问题的答案。不管该子问题以后是否被用到,只要它被计算过,就将其结果填入表中。这就是动态规划法的基本思路。具体的动态规划算法多种多样,但它们具有相同的填表格式。

以上出自百度百科

搜索求01背包和dp求01背包:

int rec(int i,int j){
    if (i==n) return 0;
    if (w[i]>j) return rec(i+1,j);
    else return max(rec(i+1,j),rec(i+1,j-w[i])+v[i]);
}
void DP(){
    for (int i=0;i<n;i++){
        for (int j=W;j>=w[i];j--){
            dp[i+1][j]=max(dp[i][j],dp[i][j-w[i]]+v[i]);
        }
    }
    printf("%d\n",dp[n][W]);
}

一道区间dp的dp求法和搜索求法:

void solve(){
    for (int q=0;q<=Q;q++) dp[q][q+1]=0;
    for (int w=2;w<=Q+1;w++){
        for (int i=0;i+w<=Q+1;i++){
            int j=i+w,t=INF;
            for (int k=i+1;k<j;k++) t=min(t,dp[i][k]+dp[k][j]);
            dp[i][j]=t+A[j]-A[i]-2;
        }
    }
    printf("%d\n",dp[0][Q+1]);
}
int DP2(int a,int b){
    if (dp[a][b]!=-1) return dp[a][b];
    if (b-a<=1) return 0;
    int t=INF;
    for (int i=a+1;i<b;i++)
        t=min(t,DP2(a,i)+DP2(i,b));
    return dp[a][b]=t+A[b]-A[a]-2;
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值