关于dp 动态规划的一些思考

        最近,在leetcode上刷题,总是遇到动态规划的问题,这块不弄明白的话,之后刷题之路寸步难行啊。看过很多文章,都写的很好,这个文章只是我个人的感悟。也有参考一些网上的定义和思路,在此感谢。


概念

        动态规划在查找有很多重叠子问题的情况的最优解时有效。它将问题重新组合成子问题。为了避免多次解决这些子问题,它们的结果都逐渐被计算并被保存,从简单的问题直到整个问题都被解决。因此,动态规划保存递归时的结果,因而不会在解决同样的问题时花费不必要的时间。

        动态规划只能应用于有最优子结构的问题。最优子结构的意思是局部最优解能决定全局最优解(对有些问题这个要求并不能完全满足,故有时需要引入一定的近似)。简单地说,问题能够分解成子问题来解决。

适用情况

  1. 最优子结构性质。如果问题的最优解所包含的子问题的解也是最优的,我们就称该问题具有最优子结构性质(即满足最优化原理)。最优子结构性质为动态规划算法解决问题提供了重要线索。
  2. 无后效性。即子问题的解一旦确定,就不再改变,不受在这之后、包含它的更大的问题的求解决策影响。
  3. 子问题重叠性质。子问题重叠性质是指在用递归算法自顶向下对问题进行求解时,每次产生的子问题并不总是新问题,有些子问题会被重复计算多次。动态规划算法正是利用了这种子问题的重叠性质,对每一个子问题只计算一次,然后将其计算结果保存在一个表格中,当再次需要计算已经计算过的子问题时,只是在表格中简单地查看一下结果,从而获得较高的效率,降低了时间复杂度。

题目

        1155. 掷骰子等于目标和的方法数

这里有 n 个一样的骰子,每个骰子上都有 k 个面,分别标号为 1 到 k 。

给定三个整数 n ,  k 和 target ,返回可能的方式(从dp[i][j] = dp[i][j] + f[i - 1][j - x]总共 kn 种方式中)滚动骰子的数量,使正面朝上的数字之和等于 target 。

答案可能很大,你需要对 10^9 + 7 取模 。


分析题目

        这个题目我们可以看到,它的结果是可以由前面来推导出来的。假设当前骰子n的点数为m,第n-1个骰子累计点数是target - m,当我第n个骰子投出m点数,我就可以达到target了。

        而我们并不知道m点数是多少,可能是1,可能是2,可能是小于等于k的任意点数。因此,我们需要把上一步的这些情况都加起来,他们都能达到我们目标的这一步,对此我们只需要多付出一个循环,来遍历骰子可投出的各种情况。

        不要忘了,为了不爆int,我们需要对结果不断取余,为什么偏偏对10^9 + 7来取余,因为它是最小的10位数的质数,很多问题都是对它取余。

        因此,我们可以推出重叠子问题的方程:

        dp[i][j] = (dp[i][j] + dp[i - 1][j - m]) % 1000000007;

代码

class Solution {
public:
    int numRollsToTarget(int n, int k, int target) {
        // 声明二维数组,dp[n+1][target+1]
        vector<vector<int>> dp(n+1,vector<int>(target + 1));
        // 点数为0的情况只有不投的这一种
        dp[0][0] = 1;
        // 对每个骰子投出的情况进行遍历
        for(int i = 1;i <= n;i++){
            //  对累计投出的点数进行遍历
            for(int j = 0;j <= target;j++){
                // 对当前骰子投出的情况进行遍历
                for(int m = 1;m <= k;m++){
                    // 如果当前投出的点数不超出的情况允许的点数,则进行计算。否则,不做计算
                    if(j - m >= 0){
                        dp[i][j] = (dp[i][j] + dp[i - 1][j - m]) % 1000000007;
                    }
                }
            }
        }
        // 返回最终可达到目标的结果
        return dp[n][target];
    }
};

动态规划的一般性模板

dp数组声明,dp[i][j]   表示第 i 个物品,达到 j 价值。dp[i][j]存入的值表示,存入i个物品,达到 j 价值的情况数目,看题目要解什么是最优最差还是全部情况。

dp[0][0] = 初始化情况;

for(物品个数遍历){

        for(题目要求的总价值遍历){

                for(单个物品能够提供的价值情况遍历){

                        if(范围的判断){

                                加入数组dp结果,存最优或最差的就需要min或者max判断,存全部的直接全加起来

                        }

                }

        }

}

return dp[n][target]

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值