石子游戏--动态规划

本文详细探讨了不同类型的石子游戏,包括动态规划的解法和博弈策略。从石子游戏一到石子游戏七,每个游戏都涉及动态规划思想,分析了如何在不同情况下制定最佳策略,以达到赢得比赛的目标。
摘要由CSDN通过智能技术生成

本文记录各种各样的石子游戏题目和解法,石子游戏大多动态规划方法来处理,作为一个两人游戏,又可以从博弈的角度考虑。

题目中的英文名字太拗口,我们讨论时均以甲乙作为称呼

石子游戏一

 亚历克斯和李用几堆石子在做游戏。偶数堆石子排成一行,每堆都有正整数颗石子 piles[i] 。游戏以谁手中的石子最多来决出胜负。石子的总数是奇数,所以没有平局。

 亚历克斯和李轮流进行,亚历克斯先开始。 每回合,玩家从行的开始或结束处取走整堆石头。 这种情况一直持续到没有更多的石子堆为止,此时手中石子最多的玩家获胜。

 假设亚历克斯和李都发挥出最佳水平,当亚历克斯赢得比赛时返回 true ,当李赢得比赛时返回 false 。

先不考虑偶数问题,假如石子堆可以是奇数的,使用动态规划的思想先定义dp数组 

    dp[i][j] 表示当前从石子堆的i--j中,可以获取的最大数量。

       那么 dp[i][j] 就应该是下面两个情况下的较大者

 1 选前面的, piles[i] + 剩下是石子中在乙选择后,下一步能甲拿到的石子数量

 2选后面的,piles[j]+剩下是石子中在乙选择后,下一步能甲拿到的石子数量

由于乙也会发挥最佳水平,当剩下 plies[i+1]----piles[j] 时,乙也会做一次最佳决策,这样又陷入递归的噩梦里,因此这个递推公式还不完整.

引入一个数组sum[i][j], 代表piles[i] --- plies[j] 所有石子的和

那么当轮到乙挑选时,假设乙发挥最佳水平可以拿到x个石子,那么甲就可以获取剩下的sum[i+1][j] -x个。

因此上述地推公式变成

   1 选前面的, piles[i] + sum[i+1][j] - dp[i+1][j]

             2 选后面的,   plies[j] +sum[i][j-1]  - dp[i][j-1]

class Solution {
public:
    bool stoneGame(vector<int>& piles) {
        int n = piles.size();
        vector<vector<int>> dp(n,vector<int>(n,0));
        vector<vector<int>> sum(n,vector<int>(n,0));

        for(int i=0; i<n; i++) {
          for(int j=i;j<n; j++) {
            if(i == j) sum[i][j] = piles[i];
            else sum[i][j] = sum[i][j-1] + piles[j];
          }
        }

        for(int i=0; i<n; i++) {
          for(int j=i;j<n; j++) {
            if(i == j) {
              dp[i][j] = piles[i];
              continue;
            }
            
            //pick_first
            int x = piles[i] + sum[i+1][j] - dp[i+1][j];
            //pick last
            int y = piles[j] + sum[i][j-1] - dp[i][j-1];
            dp[i][j] = std::max(x,y);
          }
        }
        return dp[0][n-1] * 2 >sum[0][n-1];
    }
};

另外当总数是偶数时, 第一个拿取的人一定能赢

石子游戏 二
 

亚历克斯和李继续他们的石子游戏。许多堆石子 排成一行,每堆都有正整数颗石子 piles[i]。游戏以谁手中的石子最多来决出胜负。

亚历克斯和李轮流进行,亚历克斯先开始。最初,M = 1

在每个玩家的回合中,该玩家可以拿走剩下的 前 X 堆的所有石子,其中 1 <= X <= 2M。然后,令 M = max(M, X)

游戏一直持续到所有石子都被拿走。

假设亚历克斯和李都发挥出最佳水平,返回亚历克斯可以得到的最大数量的石头。

同样采用动态规划的思路,正向思路即记忆化搜索,代码复杂但是好理解

反向思路需要逆向遍历数组

这里给出记忆化搜索方法,要特别注意边界值问题。

M的最大值应为数组长度的一半,因为 1+2+4+8<16 ,而且至少要为1,所以加1处理 

class Solution {
public:
    int stoneGameII(vector<int>& piles) {
        int n = piles.size();
        K = n/2+1; // M的最大值
        dp = 
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值