边工作边刷题:70天一遍leetcode: day 100

Coins in a Line, Flip Game, Nim Game

都是一类题,基本思路都是game AI里的minimax方法。基本方法网上很多,这里说说如何记住minimax算法结构。本质上是recursion,一般的recursion只需要每层做一次选择,但是对于minimax,因为一回合是两个player的决策,所以需要两个选择,然后再递归到下一层。recursion function的返回值优化特定player的value(一般是先手,这里假设player 1)。当player 1选择时,其一定选择几种可能的最大值,同理,当player 2选择时,其一定选择使player 1的value最小的选项。注意因为recursion function返回player 1的最优值,只有player 1的选择时累加value
递归的end condition是胜负结果都能直接一步得到,这样最优解也可以直接得到。

naive的递归存在大量重复计算,因为多条选择路径可以到达某一个subgame。可以用memoization or dp来优化。memoization比较简单:每次产生了subgame的最优解就存起来,每次进入递归检查是否解已经存在,如果存在就可以直接返回。dp的本质是用iteration来重构recursion的路径,然后沿着路径一步步(bottom up)求解subgame。

class Solution(object):
    def canWinNim(self, n):
        """
        :type n: int
        :rtype: bool
        """
        return n%4!=0

转载于:https://www.cnblogs.com/absolute/p/5983284.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值