极小化极大和动态规划之间的故事 2

本文探讨了极小化极大原则在LeetCode中的应用,通过两个具体的例子——464题和486题,阐述如何解决这类博弈问题。在464题中,通过状态压缩技术降低动态规划的空间复杂度。而在486题中,题目是对石子游戏的扩展,需要找到最优的猜测策略。同时,文章提到了375题,指出在寻找最佳猜测策略时,需要考虑所有可能的情况并选择花费最少的方案。
摘要由CSDN通过智能技术生成

极小化极大和动态规划之间的故事 2

今天我们继续上次没有讲完的故事。

1 我能赢吗

Leetcode 464:

    在 "100 game" 这个游戏中,两名玩家轮流选择从 1 到 10 的任意整数,累计
整数和,先使得累计整数和达到 100 的玩家,即为胜者。
    如果我们将游戏规则改为 “玩家不能重复使用整数” 呢?
    例如,两个玩家可以轮流从公共整数池中抽取从 1 到 15 的整数(不放回),直
到累计整数和 >= 100。
    给定一个整数 maxChoosableInteger (整数池中可选择的最大数)和另一个整数
 desiredTotal(累计和),判断先出手的玩家是否能稳赢(假设两位玩家游戏时都表
 现最佳)?
    你可以假设 maxChoosableInteger 不会大于 20, desiredTotal 不会大于 
300。

示例:
输入:
maxChoosableInteger = 10
desiredTotal = 11
输出:
false

解释:
    无论第一个玩家选择哪个整数,他都会失败。
    第一个玩家可以选择从 1 到 10 的整数。
    如果第一个玩家选择 1,那么第二个玩家只能选择从 2 到 10 的整数。
    第二个玩家可以通过选择整数 10(那么累积和为 11 >= desiredTotal),从而
取得胜利.
    同样地,第一个玩家选择任意其他整数,第二个玩家都会赢。

很显然,这又是一个极小化极大的问题。之前已经提到过,极小化极大往往会重复计算很多次,就比如这道题,先手拿走1后手拿走2,和先手拿走2后手拿走1,是完全等价的。因此,为了避免重复计算,我们需要把“1和2已经被拿走”这个状态以及它的答案(先手能否稳赢)记录下来。 但这就有一个问题,题目条件是整数池的大小 maxChoosableInteger 不大于20,也就是说整个动态规划空间最高会达到20维,这显然是不可接受的。因为这个,之前还犯了一个错误,就是我误以为只需要记录整数池内所有剩下数的和就可以了,如果是这样可行的话,那么动态规划空间就是一维的,但后来发现这是不可行的,因为整数池内还剩下1和2,和还剩下3的状态显然是不能等价的,但是它们的和都是3,因此不能只记录整数池内剩下整数的和。

既然动态空间的维度过高,现在就要想办法对状态进行压缩了。 对于一个数字来说,它只有两种状态:在整数池内,或不在。因此只需要一个比特,而非一个int型,就可以表示一个数的所有状态。而整数池最多有20个数,int型是32位,因此只需要一个int型,就可以表示所有数的所有状态。

对状态进行压缩以后,就可以写代码了。值得注意的是,当整数池内的所有数之和比目标数还要小的时候,两个玩家都无法获胜,这种情况也属于先手无法获胜,因此也要返回false。 这道题实现的代码如下:

class Solution 
{
   
public:
    bool canIWin(int maxChoosableInteger, int desiredTotal) 
    {
   
        int state = 0;
        map<int, int> hash;
        return minMax(maxChoosableInteger, desiredTotal, state, hash);
    }
    bool minMax(int maxChoosableInteger, int desiredTotal, int state, 
        map<int, int>& hash)
    {
   
        if (hash[state] == 1) {
    return true; }
        if (hash[state] == -1) {
    return false; }
        if (stateToSum(state, maxChoosableInteger) < desiredTotal) 
        
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值