877. 石头游戏

877. 石头游戏

亚历克斯和李用几堆石子在做游戏。偶数堆石子排成一行,每堆都有正整数颗石子 piles[i]

游戏以谁手中的石子最多来决出胜负。石子的总数是奇数,所以没有平局。

亚历克斯和李轮流进行,亚历克斯先开始。 每回合,玩家从行的开始或结束处取走整堆石头。 这种情况一直持续到没有更多的石子堆为止,此时手中石子最多的玩家获胜。

假设亚历克斯和李都发挥出最佳水平,当亚历克斯赢得比赛时返回 true ,当李赢得比赛时返回 false

示例:

输入:[5,3,4,5]
输出:true
解释:
亚历克斯先开始,只能拿前 5 颗或后 5 颗石子 。
假设他取了前 5 颗,这一行就变成了 [3,4,5] 。
如果李拿走前 3 颗,那么剩下的是 [4,5],亚历克斯拿走后 5 颗赢得 10 分。
如果李拿走后 5 颗,那么剩下的是 [3,4],亚历克斯拿走后 4 颗赢得 9 分。
这表明,取前 5 颗石子对亚历克斯来说是一个胜利的举动,所以我们返回 true 。

提示:

  1. 2 <= piles.length <= 500
  2. piles.length 是偶数。
  3. 1 <= piles[i] <= 500
  4. sum(piles) 是奇数。

使用动态规划算法求解

状态包括:

  • 石头序列 piles[i…j] 开始索引 i
  • 石头序列 piles[i…j] 结尾索引 j
  • 取石头的人 k (k 的取值范围是 {0, 1},0 代表先手 1 代表后手)

dp[i][j][k] 表示对于 piles[i…j] 这一堆石头, k 能拿到的最高分数。

k = 0 表示先手取石子,可以取左边(得到 piles[i],然后面对 piles[i+1…j] 时作为后手),可以取右边(得到 piles[j],然后面对 piles[i…j-1] 时作为后手)。

dp[i][j][0] = max(dp[i+1][j][1] + piles[i], dp[i][j-1][1] + piles[j])

若先手取左边,后手面对 piles[i+1…j] 时作为先手;

dp[i][j][1] = dp[i+1][j][0]

若先手取右边,后手面对 piles[i…j-1] 时作为先手;

dp[i][j][1] = dp[i][j-1][0]

初始情况:

i == j,即只有一堆石子,先手拿走全部 dp[i][j][0] = piles[i], dp[i][j][1] = 0

推导 dp[i][j][k] 需要知道 dp[i+1][j][k] 和 dp[i][j-1][k], dp矩阵中的相对位置如下,需要斜着遍历数组。
d p [ k ] i , j − 1 d p [ k ] i , j d p [ k ] i + 1 , j − 1 d p [ k ] i + 1 , j \begin{matrix} dp[k]_{i,j-1} & dp[k]_{i,j} \\ dp[k]_{i+1,j-1} & dp[k]_{i+1,j}\\ \end{matrix} dp[k]i,j1dp[k]i+1,j1dp[k]i,jdp[k]i+1,j

class Solution:
    def stoneGame(self, piles: List[int]) -> bool:
        piles_size = len(piles)

        # 初始化 dp
        dp = [[[0, 0] if i != j else [piles[i], 0] for j in range(piles_size)] for i in range(piles_size)]

        # 斜着遍历
        for t in range(piles_size):
            for i in range(piles_size-t):
                j = i + t
                if i == j: continue
                left = dp[i+1][j][1] + piles[i]
                right = dp[i][j-1][1] + piles[j]
                if left > right:
                    dp[i][j][0] = left
                    dp[i][j][1] = dp[i+1][j][0]
                else:
                    dp[i][j][0] = right
                    dp[i][j][1] = dp[i][j-1][0]
        
        return True if dp[0][piles_size-1][0] > dp[0][piles_size-1][1] else False
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值