石子游戏--动态规划

最新推荐文章于 2022-06-21 21:54:38 发布

hang_ning

最新推荐文章于 2022-06-21 21:54:38 发布

阅读量1.1k

点赞数

文章标签：动态规划算法

本文链接：https://blog.csdn.net/hang_ning/article/details/121120671

版权

本文详细探讨了不同类型的石子游戏，包括动态规划的解法和博弈策略。从石子游戏一到石子游戏七，每个游戏都涉及动态规划思想，分析了如何在不同情况下制定最佳策略，以达到赢得比赛的目标。

摘要由CSDN通过智能技术生成

本文记录各种各样的石子游戏题目和解法，石子游戏大多动态规划方法来处理，作为一个两人游戏，又可以从博弈的角度考虑。

题目中的英文名字太拗口，我们讨论时均以甲乙作为称呼

石子游戏一

　亚历克斯和李用几堆石子在做游戏。偶数堆石子排成一行，每堆都有正整数颗石子 piles[i] 。游戏以谁手中的石子最多来决出胜负。石子的总数是奇数，所以没有平局。

　亚历克斯和李轮流进行，亚历克斯先开始。每回合，玩家从行的开始或结束处取走整堆石头。这种情况一直持续到没有更多的石子堆为止，此时手中石子最多的玩家获胜。

　假设亚历克斯和李都发挥出最佳水平，当亚历克斯赢得比赛时返回 true ，当李赢得比赛时返回 false 。

先不考虑偶数问题，假如石子堆可以是奇数的，使用动态规划的思想先定义dp数组　

　　　　dp[i][j] 表示当前从石子堆的i--j中，可以获取的最大数量。

那么　dp[i][j]　就应该是下面两个情况下的较大者

　1 选前面的， piles[i] + 剩下是石子中在乙选择后，下一步能甲拿到的石子数量

　２选后面的，piles[j]+剩下是石子中在乙选择后，下一步能甲拿到的石子数量

由于乙也会发挥最佳水平，当剩下　plies[i+1]----piles[j] 时，乙也会做一次最佳决策，这样又陷入递归的噩梦里，因此这个递推公式还不完整.

引入一个数组sum[i][j], 代表piles[i] --- plies[j] 所有石子的和

那么当轮到乙挑选时，假设乙发挥最佳水平可以拿到x个石子，那么甲就可以获取剩下的sum[i+1][j] -x个。

因此上述地推公式变成

　　　1 选前面的， piles[i] + sum[i+1][j] - dp[i+1][j]

2 选后面的, plies[j] +sum[i][j-1] - dp[i][j-1]

class Solution {
public:
    bool stoneGame(vector<int>& piles) {
        int n = piles.size();
        vector<vector<int>> dp(n,vector<int>(n,0));
        vector<vector<int>> sum(n,vector<int>(n,0));

        for(int i=0; i<n; i++) {
          for(int j=i;j<n; j++) {
            if(i == j) sum[i][j] = piles[i];
            else sum[i][j] = sum[i][j-1] + piles[j];
          }
        }

        for(int i=0; i<n; i++) {
          for(int j=i;j<n; j++) {
            if(i == j) {
              dp[i][j] = piles[i];
              continue;
            }
            
            //pick_first
            int x = piles[i] + sum[i+1][j] - dp[i+1][j];
            //pick last
            int y = piles[j] + sum[i][j-1] - dp[i][j-1];
            dp[i][j] = std::max(x,y);
          }
        }
        return dp[0][n-1] * 2 >sum[0][n-1];
    }
};

另外当总数是偶数时，第一个拿取的人一定能赢

石子游戏　二

亚历克斯和李继续他们的石子游戏。许多堆石子排成一行，每堆都有正整数颗石子 piles[i]。游戏以谁手中的石子最多来决出胜负。

亚历克斯和李轮流进行，亚历克斯先开始。最初，M = 1。

在每个玩家的回合中，该玩家可以拿走剩下的前 X 堆的所有石子，其中 1 <= X <= 2M。然后，令 M = max(M, X)。

游戏一直持续到所有石子都被拿走。

假设亚历克斯和李都发挥出最佳水平，返回亚历克斯可以得到的最大数量的石头。

同样采用动态规划的思路，正向思路即记忆化搜索，代码复杂但是好理解

反向思路需要逆向遍历数组

这里给出记忆化搜索方法，要特别注意边界值问题。

Ｍ的最大值应为数组长度的一半，因为　1+2+4+8<16　，而且至少要为１，所以加１处理

class Solution {
public:
    int stoneGameII(vector<int>& piles) {
        int n = piles.size();
        K = n/2+1;　// M的最大值
        dp =

最低0.47元/天解锁文章

hang_ning

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
石子游戏--动态规划

本文记录各种各样的石子游戏题目和解法，石子游戏大多动态规划方法来处理。石子游戏一　亚历克斯和李用几堆石子在做游戏。偶数堆石子排成一行，每堆都有正整数颗石子piles[i]。游戏以谁手中的石子最多来决出胜负。石子的总数是奇数，所以没有平局。　亚历克斯和李轮流进行，亚历克斯先开始。每回合，玩家从行的开始或结束处取走整堆石头。这种情况一直持续到没有更多的石子堆为止，此时手中石子最多的玩家获胜。　假设亚历克斯和李都发挥出最佳水平，当亚历克斯赢得比..
复制链接

扫一扫