LeetCode第183场周赛:5379. 石子游戏 III(博弈)

Alice 和 Bob 用几堆石子在做游戏。几堆石子排成一行,每堆石子都对应一个得分,由数组 stoneValue 给出。

Alice 和 Bob 轮流取石子,Alice 总是先开始。在每个玩家的回合中,该玩家可以拿走剩下石子中的的前 1、2 或 3 堆石子 。比赛一直持续到所有石头都被拿走。

每个玩家的最终得分为他所拿到的每堆石子的对应得分之和。每个玩家的初始分数都是 0 。比赛的目标是决出最高分,得分最高的选手将会赢得比赛,比赛也可能会出现平局。

假设 Alice 和 Bob 都采取 最优策略 。如果 Alice 赢了就返回 "Alice" ,Bob 赢了就返回 "Bob",平局(分数相同)返回 "Tie" 。

 

示例 1:

输入:values = [1,2,3,7]
输出:"Bob"
解释:Alice 总是会输,她的最佳选择是拿走前三堆,得分变成 6 。但是 Bob 的得分为 7,Bob 获胜。
示例 2:

输入:values = [1,2,3,-9]
输出:"Alice"
解释:Alice 要想获胜就必须在第一个回合拿走前三堆石子,给 Bob 留下负分。
如果 Alice 只拿走第一堆,那么她的得分为 1,接下来 Bob 拿走第二、三堆,得分为 5 。之后 Alice 只能拿到分数 -9 的石子堆,输掉比赛。
如果 Alice 拿走前两堆,那么她的得分为 3,接下来 Bob 拿走第三堆,得分为 3 。之后 Alice 只能拿到分数 -9 的石子堆,同样会输掉比赛。
注意,他们都应该采取 最优策略 ,所以在这里 Alice 将选择能够使她获胜的方案。
示例 3:

输入:values = [1,2,3,6]
输出:"Tie"
解释:Alice 无法赢得比赛。如果她决定选择前三堆,她可以以平局结束比赛,否则她就会输。
示例 4:

输入:values = [1,2,3,-1,-2,-3,7]
输出:"Alice"
示例 5:

输入:values = [-1,-2,-3]
输出:"Tie"
 

提示:

1 <= values.length <= 50000
-1000 <= values[i] <= 1000

思路:由题意可知,由于两个玩家所受到的约束条件是相同的, 因此该博弈模型为最基础的平等博弈。

我们考虑倒着思考问题,设dp[i]表示当前玩家从i开始取所能得到的最大和,由于当只剩一堆时,当前玩家必须要取走,因此边界条件为dp[n-1]=stoneValue[n-1],而从n-2开始我们就要思考当前到底应该取1堆还是2堆或者3堆,因为每个玩家都采取的最优策略,因此当前玩家一定让下一个玩家所获得的最大和最小,我们设一个变量sum求遍历到i位置时的后缀和,因此当前玩家所采取的策略一定要使得sum-dp[i+k]最大,k只能取1,2,3。

博弈论一直是自己的弱项,加油辣~

class Solution {	
    public String stoneGameIII(int[] stoneValue) {
    	
    	int sum=0;
    	int len=stoneValue.length;
    	int[] dp=new int[len+1];
    	
    	for(int i=len-1;i>=0;i--) {
    		sum+=stoneValue[i];
    		dp[i]=sum-dp[i+1];
    		if(i+2<=len) dp[i]=Math.max(dp[i], sum-dp[i+2]);
    		if(i+3<=len) dp[i]=Math.max(dp[i], sum-dp[i+3]);
    	}
    	
    	if(dp[0]*2>sum) return "Alice";
    	else if(dp[0]*2==sum)
    		return "Tie";
    	else
    		return "Bob";
    }
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值