leetcode877. 石子游戏
来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/stone-game
题目描述
Alice 和 Bob 用几堆石子在做游戏。一共有偶数堆石子,排成一行;每堆都有 正 整数颗石子,数目为 piles[i] 。
游戏以谁手中的石子最多来决出胜负。石子的 总数 是 奇数 ,所以没有平局。
Alice 和 Bob 轮流进行,Alice 先开始 。 每回合,玩家从行的 开始 或 结束 处取走整堆石头。 这种情况一直持续到没有更多的石子堆为止,此时手中 石子最多 的玩家 获胜 。
假设 Alice 和 Bob 都发挥出最佳水平,当 Alice 赢得比赛时返回 true ,当 Bob 赢得比赛时返回 false 。
示例1:
输入:piles = [5,3,4,5]
输出:true
解释:
Alice 先开始,只能拿前 5 颗或后 5 颗石子 。
假设他取了前 5 颗,这一行就变成了 [3,4,5] 。
如果 Bob 拿走前 3 颗,那么剩下的是 [4,5],Alice 拿走后 5 颗赢得 10 分。
如果 Bob 拿走后 5 颗,那么剩下的是 [3,4],Alice 拿走后 4 颗赢得 9 分。
这表明,取前 5 颗石子对 Alice 来说是一个胜利的举动,所以返回 true 。
示例 2:
输入:piles = [3,7,2,3]
输出:true
提示:
2 <= piles.length <= 500
piles.length 是 偶数
1 <= piles[i] <= 500
sum(piles[i]) 是 奇数
暴力递归
做动态规划的题时,刚开始很难直接就看出状态转移方程.我们可以先把递归尝试,模型写出来,然后去改造递归,这样很容易完成动态规划的题了.所有动态规划的题,都可以按这个套路
我们先看如何写出暴力递归.
因为是两个玩家,交替拿值,所以应该是两个递归,一个是先手玩家去拿.一个后手玩家去拿,先手玩家可以选择拿开始位置或者结束位置两种情况,因此要找出最优解,所以,先手要拿最大值.只需要比较拿开始位置和结束位置的最大值就可以了.
后手玩家只能在先手拿剩下的里面去拿.两个递归嵌套关系就有了,我们直接代码演示把:
代码演示
public static boolean stoneGame(int[] piles) {
int f = f(piles,0,piles.length - 1);
int g = g(piles,0,piles.length - 1);
return f > g;
}
/**
* 先手玩家 Alice
* @param piles
* @param L 起始位置
* @param R 结束位置
* @return
*/
public static int f(int[]piles,int L , int R){
//base case 越界直接返回
if (L > R){
return 0;
}
//L == R 说明只剩一个位置,先手拿走
if(L == R){
return piles[L];
}
//两种情况 选择 L 或者选择R
int p1 = piles[L] + g(piles,L + 1,R);
int p2 = piles[R] + g(piles,L,R - 1);
//取两种情况的最优解
return Math.max(p1,p2);
}
/**
* 后手玩家 Bob
* @param piles
* @param L 开始位置
* @param R 结束位置
* @return
*/
public static int g(int[]piles,int L,int R){
//base case 越界或者只剩一个时,都是0,因为只剩一个也会被先手玩家拿走
if(L >= R){
return 0;
}
//先手拿走 L 时
int p1 = f(piles,L + 1,R);
//先手拿走 R 时
int p2 = f(piles,L,R - 1);
//先手会选择最优解拿,所以会给剩下次优解.返回两者中的次优解
return Math.min(p1,p2);
}
动态规划
暴力递归改动态规划时,就是对暴力递归的改写.根据暴力递归的过程,我看查看其依赖关系,来找出状态转移方程,
看图演示:
arr = {5,7,6,4,3,1}
上面表格代表先手dp 表
下面表格代表后手dp表.
L 代表行 R 代表列.
如果L == R 时,先手肯定会拿走,因为只剩一个,所以先手初始化出arr[i] 的值.
后手都是0.
根据递归里;
int p1 = piles[L] + g(piles,L + 1,R);
int p2 = piles[R] + g(piles,L,R - 1);
得出 先手的状态转移方程是
int p1 = piles[L] + dp2[L + 1][R];
int p2 = piles[R] + dp2[L][R - 1];
dp1[L][R] = Math.max(p1,p2);
后手是:
int p3 = dp1[L + 1][R];
int p4 = dp1[L][R - 1];
dp2[L][R] = Math.min(p3,p4);
状态方程有了,可以直接写代码了:
/**
* 动态规划
* @param piles
* @return
*/
public static boolean dp(int[] piles){
int N = piles.length;
//先手
int[][]dp1 = new int[N][N];
//后手
int[][]dp2 = new int[N][N];
for (int i = 0; i < N ; i++){
dp1[i][i] = piles[i];
int R = i;
int L = 0;
while (R < N){
int p1 = piles[L] + dp2[L + 1][R];
int p2 = piles[R] + dp2[L][R - 1];
dp1[L][R] = Math.max(p1,p2);
int p3 = dp1[L + 1][R];
int p4 = dp1[L][R - 1];
dp2[L][R] = Math.min(p3,p4);
L++;
R++;
}
}
return dp1[0][N - 1] > dp2[0][N - 1];
}