leetcode877. 石子游戏(动态规划-java)

最新推荐文章于 2024-08-24 03:59:24 发布

SP_1024

最新推荐文章于 2024-08-24 03:59:24 发布

阅读量1.6k

点赞数

分类专栏：算法数据结构 java 文章标签：动态规划游戏 java leetcode 算法数据结构

本文链接：https://blog.csdn.net/SP_1024/article/details/131352068

版权

算法同时被 3 个专栏收录

274 篇文章 3 订阅

订阅专栏

java

265 篇文章 2 订阅

订阅专栏

数据结构

235 篇文章 0 订阅

订阅专栏

文章介绍了LeetCode第877题——石子游戏的解题思路。Alice和Bob玩石子游戏，有偶数堆石子，每堆数量为piles[i]，总数量为奇数。Alice先手，目标是获得最多石子。文章通过暴力递归的方法，展示了如何逐步构建动态规划的解决方案，最后给出了动态规划的代码实现。

摘要由CSDN通过智能技术生成

leetcode877. 石子游戏

来源：力扣（LeetCode）
链接：https://leetcode.cn/problems/stone-game

题目描述

Alice 和 Bob 用几堆石子在做游戏。一共有偶数堆石子，排成一行；每堆都有正整数颗石子，数目为 piles[i] 。
游戏以谁手中的石子最多来决出胜负。石子的总数是奇数，所以没有平局。
Alice 和 Bob 轮流进行，Alice 先开始。每回合，玩家从行的开始或结束处取走整堆石头。这种情况一直持续到没有更多的石子堆为止，此时手中石子最多的玩家获胜。
假设 Alice 和 Bob 都发挥出最佳水平，当 Alice 赢得比赛时返回 true ，当 Bob 赢得比赛时返回 false 。

示例1:
输入：piles = [5,3,4,5]
输出：true
解释：
Alice 先开始，只能拿前 5 颗或后 5 颗石子。
假设他取了前 5 颗，这一行就变成了 [3,4,5] 。
如果 Bob 拿走前 3 颗，那么剩下的是 [4,5]，Alice 拿走后 5 颗赢得 10 分。
如果 Bob 拿走后 5 颗，那么剩下的是 [3,4]，Alice 拿走后 4 颗赢得 9 分。
这表明，取前 5 颗石子对 Alice 来说是一个胜利的举动，所以返回 true 。

示例 2：
输入：piles = [3,7,2,3]
输出：true

提示：
2 <= piles.length <= 500
piles.length 是偶数
1 <= piles[i] <= 500
sum(piles[i]) 是奇数

暴力递归

做动态规划的题时,刚开始很难直接就看出状态转移方程.我们可以先把递归尝试,模型写出来,然后去改造递归,这样很容易完成动态规划的题了.所有动态规划的题,都可以按这个套路
我们先看如何写出暴力递归.
因为是两个玩家,交替拿值,所以应该是两个递归,一个是先手玩家去拿.一个后手玩家去拿,先手玩家可以选择拿开始位置或者结束位置两种情况,因此要找出最优解,所以,先手要拿最大值.只需要比较拿开始位置和结束位置的最大值就可以了.
后手玩家只能在先手拿剩下的里面去拿.两个递归嵌套关系就有了,我们直接代码演示把:

代码演示

public static boolean stoneGame(int[] piles) {
        int f = f(piles,0,piles.length - 1);
        int g = g(piles,0,piles.length - 1);
        return f > g;
    }

    /**
     * 先手玩家 Alice
     * @param piles
     * @param L 起始位置
     * @param R 结束位置
     * @return
     */
    public static int f(int[]piles,int L , int R){
        //base case  越界直接返回
        if (L > R){
            return 0;
        }
        //L == R 说明只剩一个位置,先手拿走
        if(L == R){
            return piles[L];
        }
        //两种情况 选择 L 或者选择R
        int p1 = piles[L] + g(piles,L + 1,R);
        int p2 = piles[R] + g(piles,L,R - 1);
        //取两种情况的最优解
        return Math.max(p1,p2);
    }

    /**
     * 后手玩家 Bob 
     * @param piles
     * @param L 开始位置
     * @param R 结束位置
     * @return
     */
    public static int g(int[]piles,int L,int R){
        //base case 越界或者只剩一个时,都是0,因为只剩一个也会被先手玩家拿走
        if(L >= R){
            return 0;
        }
        //先手拿走 L 时
        int p1 = f(piles,L + 1,R);
        //先手拿走 R 时
        int p2 = f(piles,L,R - 1);
        //先手会选择最优解拿,所以会给剩下次优解.返回两者中的次优解
        return Math.min(p1,p2);
    }

动态规划

暴力递归改动态规划时,就是对暴力递归的改写.根据暴力递归的过程,我看查看其依赖关系,来找出状态转移方程,
看图演示:

arr = {5,7,6,4,3,1}
上面表格代表先手dp 表
下面表格代表后手dp表.
L 代表行 R 代表列.
如果L == R 时,先手肯定会拿走,因为只剩一个,所以先手初始化出arr[i] 的值.
后手都是0.
根据递归里;
int p1 = piles[L] + g(piles,L + 1,R);
int p2 = piles[R] + g(piles,L,R - 1);
得出先手的状态转移方程是
int p1 = piles[L] + dp2[L + 1][R];
int p2 = piles[R] + dp2[L][R - 1];
dp1[L][R] = Math.max(p1,p2);
后手是:
int p3 = dp1[L + 1][R];
int p4 = dp1[L][R - 1];
dp2[L][R] = Math.min(p3,p4);
状态方程有了,可以直接写代码了:

    /**
     * 动态规划
     * @param piles
     * @return
     */
    public static boolean dp(int[] piles){
        int N = piles.length;
        //先手
        int[][]dp1 = new int[N][N];
        //后手
        int[][]dp2 = new int[N][N];

        for (int i = 0; i < N ; i++){
            dp1[i][i] = piles[i];
            int R = i;
            int L = 0;
            while (R < N){
                int p1 = piles[L] + dp2[L + 1][R];
                int p2 = piles[R] + dp2[L][R - 1];
                dp1[L][R] = Math.max(p1,p2);
                int p3 = dp1[L + 1][R];
                int p4 = dp1[L][R - 1];
                dp2[L][R] = Math.min(p3,p4);
                L++;
                R++;
            }
        }
        return dp1[0][N - 1] > dp2[0][N - 1];
    }