JAVA程序设计:石子游戏 II(LeetCode:1140)

亚历克斯和李继续他们的石子游戏。许多堆石子 排成一行,每堆都有正整数颗石子 piles[i]。游戏以谁手中的石子最多来决出胜负。

亚历克斯和李轮流进行,亚历克斯先开始。最初,M = 1。

在每个玩家的回合中,该玩家可以拿走剩下的 前 X 堆的所有石子,其中 1 <= X <= 2M。然后,令 M = max(M, X)。

游戏一直持续到所有石子都被拿走。

假设亚历克斯和李都发挥出最佳水平,返回亚历克斯可以得到的最大数量的石头。

 

示例:

输入:piles = [2,7,9,4,4]
输出:10
解释:
如果亚历克斯在开始时拿走一堆石子,李拿走两堆,接着亚历克斯也拿走两堆。在这种情况下,亚历克斯可以拿到 2 + 4 + 4 = 10 颗石子。 
如果亚历克斯在开始时拿走两堆石子,那么李就可以拿走剩下全部三堆石子。在这种情况下,亚历克斯可以拿到 2 + 7 = 9 颗石子。
所以我们返回更大的 10。 
 

提示:

1 <= piles.length <= 100
1 <= piles[i] <= 10 ^ 4

思路:在博弈问题中,为了达到胜利,对于每一轮的玩家来说,都要充分利用当前情况来获取最大利益,换句话说就是让对方尽可能的不赢,而本题的输赢评判标准是玩家能够获得的最大石子数量,我们考虑模拟整个取石子过程,游戏从第一轮开始,为了不失一般性,我们假设经历到了第i轮,并且当前玩家最多能够取x堆(2m>=x>=1),此时要分情况讨论:

①此时没有石子了,游戏结束;

②当i+2m>=n时,呢当前玩家一定是取完所有石子的;

③当i+2m<n时,此时剩余的石子数量是piles[i:n-1],为了让自己取得尽可能多的石子,呢一定是在自己取完这轮的石子后,下一轮的玩家取的石子尽可能少,因此我们可以枚举当前玩家取得石子堆数,而为了得出最优解,我们需要知道往后的所有状态。因此这里我们就需要从后往前来求出所有状态。

方法一:针对上述思路,我们可以采用记忆化搜索来解决,dfs(i,m)表示在第i堆时,当前玩家可以取的堆数在[1,2m]之间的最优解。

class Solution {

    private int n;
    private int[] sum;
    private Map<String, Integer> map;

    public int stoneGameII(int[] piles) {

        n = piles.length;
        sum = new int[n];
        map = new HashMap<>();

        sum[n - 1] = piles[n - 1];
        for (int i = n - 2; i >= 0; i--)
            sum[i] = sum[i + 1] + piles[i];

        return dfs(0, 1);

    }

    private int dfs(int i, int m) {

        String s = String.valueOf(i) + "#" + String.valueOf(m);

        if (map.containsKey(s)) return map.get(s);

        if (i >= n) return 0;

        if (i + 2 * m >= n) return sum[i];

        int res = 0;
        for (int x = 1; x <= 2 * m; x++)
            res = Math.max(res, sum[i] - dfs(i + x, Math.max(x, m)));

        map.put(s, res);

        return res;

    }
}

方法二:进一步优化,我们将记忆化搜索改为动态规划,思想不变。

class Solution {

    public int stoneGameII(int[] piles) {

        int sum = 0;
        int n = piles.length;
        int[][] dp = new int[n][n + 1];

        for (int i = n - 1; i >= 0; i--) {
            sum += piles[i];
            for (int m = 1; m <= n; m++) {
                if (i + 2 * m >= n) dp[i][m] = sum;
                else {
                    for (int x = 1; x <= 2 * m; x++)
                        dp[i][m] = Math.max(dp[i][m], sum - dp[i + x][Math.max(x, m)]);
                }
            }
        }

        return dp[0][1];

    }
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值