LeetCode-1406-DP博弈问题应用

本文介绍了一个两人石子游戏,Alice和Bob通过选取石子堆来获取分数,目标是获得最高分。文章提供了示例和解题思路,解释了如何使用动态规划求解最优策略,并给出了Python实现代码。分析表明,根据游戏规则,Alice和Bob都将采取最优策略,最终结果可能是Alice获胜、Bob获胜或平局。
摘要由CSDN通过智能技术生成

1406. 石子游戏 III

Alice 和 Bob 用几堆石子在做游戏。几堆石子排成一行,每堆石子都对应一个得分,由数组 stoneValue 给出。

Alice 和 Bob 轮流取石子,Alice 总是先开始。在每个玩家的回合中,该玩家可以拿走剩下石子中的的前 1、2 或 3 堆石子 。比赛一直持续到所有石头都被拿走。

每个玩家的最终得分为他所拿到的每堆石子的对应得分之和。每个玩家的初始分数都是 0 。比赛的目标是决出最高分,得分最高的选手将会赢得比赛,比赛也可能会出现平局。

假设 Alice 和 Bob 都采取 最优策略 。如果 Alice 赢了就返回 "Alice" ,Bob 赢了就返回 "Bob",平局(分数相同)返回 "Tie" 。

示例 1:

输入:values = [1,2,3,7]
输出:"Bob"
解释:Alice 总是会输,她的最佳选择是拿走前三堆,得分变成 6 。但是 Bob 的得分为 7,Bob 获胜。
示例 2:

输入:values = [1,2,3,-9]
输出:"Alice"
解释:Alice 要想获胜就必须在第一个回合拿走前三堆石子,给 Bob 留下负分。
如果 Alice 只拿走第一堆,那么她的得分为 1,接下来 Bob 拿走第二、三堆,得分为 5 。之后 Alice 只能拿到分数 -9 的石子堆,输掉比赛。
如果 Alice 拿走前两堆,那么她的得分为 3,接下来 Bob 拿走第三堆,得分为 3 。之后 Alice 只能拿到分数 -9 的石子堆,同样会输掉比赛。
注意,他们都应该采取 最优策略 ,所以在这里 Alice 将选择能够使她获胜的方案。
示例 3:

输入:values = [1,2,3,6]
输出:"Tie"
解释:Alice 无法赢得比赛。如果她决定选择前三堆,她可以以平局结束比赛,否则她就会输。
示例 4:

输入:values = [1,2,3,-1,-2,-3,7]
输出:"Alice"
示例 5:

输入:values = [-1,-2,-3]
输出:"Tie"
 

提示:

1 <= values.length <= 50000
-1000 <= values[i] <= 1000

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/stone-game-iii
解析:

  • 定义:dp[i] 当前玩家从位置i走起所能获取的最大相对分数,即score = Alice-Bob
  • 初始化:dp[*] = min
  • 公式:dp[i] =max(dp[i], sum(stoneValue[i: i + k]) - dp[i + k]),k in (1 ,2, 3)
  • 结果:dp[0]
  • 复杂度:O((n-k)*k)

sum(stoneValue[i: i + 1]) - dp[i + 1]),当前走i,对手从i+1走

sum(stoneValue[i: i + 2]) - dp[i + 2]),当前走到i+1,对手从i+2走

sum(stoneValue[i: i + 3]) - dp[i + 3]),当前走到i+2,对手从i+3走

还可以计算每个人的分数,如下计算公式:

代码如下:

import sys

def stoneGameIII(stoneValue) -> str:
    n = len(stoneValue)
    stoneValue += [0, 0, 0]
    dp = [-sys.maxsize] * n + [0, 0, 0]
    for i in range(n):
        for k in (1, 2, 3):
            dp[i] = max(dp[i], sum(stoneValue[i: i + k]) - dp[i + k])
    return "Alice" if dp[0] > 0 else "Bob" if dp[0] < 0 else "Tie"

 


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值