leetcode: 新21点 (动态规划)

爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:

爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。

当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?

PS:

1. 0 <= K <= N <= 10000
2. 1 <= W <= 10000
3. 如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
4. 此问题的判断限制时间已经减少。

过去状态决定当前状态,所以用动态规划,用dp[i]表示当前手中牌为i时获胜(最终分数不超过N,也就是下一次抽到K(或不抽)且于当前相加小于N)的概率,开始时手中没牌即i=0

class Solution:
    def new21Game(self, N: int, K: int, W: int) -> float:
        dp = [0 for i in range(K + W)]
        # 因为手中牌大于等于K就不抽了,所以先填充大于等于K的情况
        for i in range(K, K + min(N - K + 1, W)):
            dp[i] = 1 if i <= N else 0
        
        dp[K - 1] = min(N - K + 1, W) / W
        # 利用两项直接的差分倒推前面的值,减小运算成本
        for i in range(K - 2, -1, -1):
            dp[i] = dp[i + 1] - (dp [i + W + 1] - dp[i + 1]) / W
        return dp[0]

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值