亚历克斯和李继续他们的石子游戏。许多堆石子 排成一行,每堆都有正整数颗石子 piles[i]。游戏以谁手中的石子最多来决出胜负。
亚历克斯和李轮流进行,亚历克斯先开始。最初,M = 1。
在每个玩家的回合中,该玩家可以拿走剩下的 前 X 堆的所有石子,其中 1 <= X <= 2M。然后,令 M = max(M, X)。
游戏一直持续到所有石子都被拿走。
假设亚历克斯和李都发挥出最佳水平,返回亚历克斯可以得到的最大数量的石头。
示例:
输入:piles = [2,7,9,4,4]
输出:10
解释:
如果亚历克斯在开始时拿走一堆石子,李拿走两堆,接着亚历克斯也拿走两堆。在这种情况下,亚历克斯可以拿到 2 + 4 + 4 = 10 颗石子。
如果亚历克斯在开始时拿走两堆石子,那么李就可以拿走剩下全部三堆石子。在这种情况下,亚历克斯可以拿到 2 + 7 = 9 颗石子。
所以我们返回更大的 10。
提示:
1 <= piles.length <= 100
1 <= piles[i] <= 10 ^ 4
思路:在博弈问题中,为了达到胜利,对于每一轮的玩家来说,都要充分利用当前情况来获取最大利益,换句话说就是让对方尽可能的不赢,而本题的输赢评判标准是玩家能够获得的最大石子数量,我们考虑模拟整个取石子过程,游戏从第一轮开始,为了不失一般性,我们假设经历到了第i轮,并且当前玩家最多能够取x堆(2m>=x>=1),此时要分情况讨论:
①此时没有石子了,游戏结束;
②当i+2m>=n时,呢当前玩家一定是取完所有石子的;
③当i+2m<n时,此时剩余的石子数量是piles[i:n-1],为了让自己取得尽可能多的石子,呢一定是在自己取完这轮的石子后,下一轮的玩家取的石子尽可能少,因此我们可以枚举当前玩家取得石子堆数,而为了得出最优解,我们需要知道往后的所有状态。因此这里我们就需要从后往前来求出所有状态。
方法一:针对上述思路,我们可以采用记忆化搜索来解决,dfs(i,m)表示在第i堆时,当前玩家可以取的堆数在[1,2m]之间的最优解。
class Solution {
private int n;
private int[] sum;
private Map<String, Integer> map;
public int stoneGameII(int[] piles) {
n = piles.length;
sum = new int[n];
map = new HashMap<>();
sum[n - 1] = piles[n - 1];
for (int i = n - 2; i >= 0; i--)
sum[i] = sum[i + 1] + piles[i];
return dfs(0, 1);
}
private int dfs(int i, int m) {
String s = String.valueOf(i) + "#" + String.valueOf(m);
if (map.containsKey(s)) return map.get(s);
if (i >= n) return 0;
if (i + 2 * m >= n) return sum[i];
int res = 0;
for (int x = 1; x <= 2 * m; x++)
res = Math.max(res, sum[i] - dfs(i + x, Math.max(x, m)));
map.put(s, res);
return res;
}
}
方法二:进一步优化,我们将记忆化搜索改为动态规划,思想不变。
class Solution {
public int stoneGameII(int[] piles) {
int sum = 0;
int n = piles.length;
int[][] dp = new int[n][n + 1];
for (int i = n - 1; i >= 0; i--) {
sum += piles[i];
for (int m = 1; m <= n; m++) {
if (i + 2 * m >= n) dp[i][m] = sum;
else {
for (int x = 1; x <= 2 * m; x++)
dp[i][m] = Math.max(dp[i][m], sum - dp[i + x][Math.max(x, m)]);
}
}
}
return dp[0][1];
}
}