力扣1690——石子游戏 VII(博弈,动态规划)

题目描述(中等)

石子游戏中,爱丽丝和鲍勃轮流进行自己的回合,爱丽丝先开始 。

有 n 块石子排成一排。每个玩家的回合中,可以从行中 移除 最左边的石头或最右边的石头,并获得与该行中剩余石头值之 和 相等的得分。当没有石头可移除时,得分较高者获胜。

鲍勃发现他总是输掉游戏(可怜的鲍勃,他总是输),所以他决定尽力 减小得分的差值 。爱丽丝的目标是最大限度地 扩大得分的差值 。

给你一个整数数组 stones ,其中 stones[i] 表示 从左边开始 的第 i 个石头的值,如果爱丽丝和鲍勃都 发挥出最佳水平 ,请返回他们 得分的差值 。

示例 1:
输入:stones = [5,3,1,4,2]
输出:6
解释:

  • 爱丽丝移除 2 ,得分 5 + 3 + 1 + 4 = 13 。游戏情况:爱丽丝 = 13 ,鲍勃 = 0 ,石子 = [5,3,1,4] 。
  • 鲍勃移除 5 ,得分 3 + 1 + 4 = 8 。游戏情况:爱丽丝 = 13 ,鲍勃 = 8 ,石子 = [3,1,4] 。
  • 爱丽丝移除 3 ,得分 1 + 4 = 5 。游戏情况:爱丽丝 = 18 ,鲍勃 = 8 ,石子 = [1,4] 。
  • 鲍勃移除 1 ,得分 4 。游戏情况:爱丽丝 = 18 ,鲍勃 = 12 ,石子 = [4] 。
  • 爱丽丝移除 4 ,得分 0 。游戏情况:爱丽丝 = 18 ,鲍勃 = 12 ,石子 = [] 。
    得分的差值 18 - 12 = 6 。

示例 2:
输入:stones = [7,90,5,1,100,10,10,2]
输出:122

提示:

n == stones.length
2 <= n <= 1000
1 <= stones[i] <= 1000

思路

首先想到贪心,但手写样例是过不去的,因为贪心只考虑到局部,对于此题局部最优不等于全局最优
所以需要动态规划来获得全局最优解
对于题目的理解,虽然A想扩大分查,B想缩小分差,但两人的目的其实是一样的,都想自己得分尽可能大
只不过这个游戏先手必赢,因为每次后手的得分都会少一部分
跳出AB两人,只考虑得分最大化
举个简单例子
a,b两堆,如果先手,要选取ab中小的,这样得分为ab中大的,而下一步后手着得分为0,这样分差最大,为max(a,b);
a,b,c三堆,当前先手可选a或c,后手者最佳选择转化为上一例子的ab两个或bc两个
对于选a,先手得分为b+c,后手者得分为bc最优解,分差为 b+c - 此情形后手者最优解
对于选c,先手得分为a+b,后手得分为ab最优解,分差为 a+b - 此情形后手最优解
如要分差最大,那么在a、c两选择中取最大分差即可,(这里将后手最优解作为已知,因为双方都是理性人)
对比上述两个分差,取最大值,那就是abc情况下的最优解
逐渐发现了递推关系,对于左右两个选择,要选择 (对应得分-对应后手最优解) 中最大值,即是此情形最优解
那么可以试着写状态转移方程了
用dp[i][j]表示i到j的最优解,起始都是0,dp[0][n-1]即为全局最优解,也就是答案
dp[i][j] = max( 选左得分(i-1到j之和) - 对应后手最优解d[i+1][j] , 选右得分(i到j-1之和) - 对应后手最优解d[i][j-1] )

稍微优化一下,求部分区间和,可以空间换时间,sum存0~i 之和,i~j之和即为sum[j] - sum[i] + stones[i]
这样转移方程写为
dp[i][j] = max(sum[j]-sum[i+1]+stones[i+1]-dp[i+1][j] , sum[j-1]-sum[i]+stones[i]-dp[i][j-1])

注意dp更新顺序,由于dp[i][j]需要用到dp[i+1][j]和dp[i][j-1],根据动态规划原则,旧的不会因为新的加入而改变,因此i从大到小循环,j从小到大循环

代码

class Solution {
public:
    int stoneGameVII(vector<int>& stones) {
        int n = stones.size();
        vector<vector<int>> dp(n,vector<int>(n,0));
        vector<int> sum(n,0);
        sum[0] = stones[0];
        for(int i = 1; i < n; i++) {
            sum[i] = sum[i-1] + stones[i];
        }
        for(int i = n-2; i >= 0; i--) {
            for(int j = i+1; j < n; j++) {
                dp[i][j] = max(sum[j]-sum[i+1]+stones[i+1]-dp[i+1][j] , sum[j-1]-sum[i]+stones[i]-dp[i][j-1]);
            }
        }    
        return dp[0][n-1];
    }
};
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值