【LeetCode】每日一题(五)[新21点]获得不少于 K 分时停止抽取数字求分数不超过 N 的概率 动态规划

837. 新21点

爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:

爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。

当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?

示例1:

输入:N = 10, K = 1, W = 10
输出:1.00000
说明:爱丽丝得到一张卡,然后停止。

示例2:

输入:N = 6, K = 1, W = 10
输出:0.60000
说明:爱丽丝得到一张卡,然后停止。
在 W = 10 的 6 种可能下,她的得分不超过 N = 6 分。

示例3:

输入:N = 21, K = 17, W = 10
输出:0.73278

提示:

0 <= K <= N <= 10000
1 <= W <= 10000
如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
此问题的判断限制时间已经减少。。

Solution

动态规划

参考官方题解

以下称分数不超过 N获胜。 爱丽丝获胜的概率只和下一轮开始前的得分有关,因此根据得分计算概率。

  • 状态:令 dp[x]表示从得分为x的情况开始游戏并且获胜的概率,目标是求 dp[0] 的值。

  • 边界情况:

    • 可以达到的最大分数:K-1+W(最后一次抽前分数为K-1,最后抽到了W)
    • K≤x≤min(N,K-1+W)时,dp[x]=1
    • x>min(N,K-1+W)时,dp[x]=0
  • 状态转移方程

    0≤x<K时,状态怎么转移?参考

    • d p [ x ] = ( d p [ x + 1 ] + d p [ x + 2 ] + . . . + d p [ x + W ] ) / W dp[x] = (dp[x+1]+dp[x+2]+...+dp[x+W])/W dp[x]=(dp[x+1]+dp[x+2]+...+dp[x+W])/W

    • 简化:

      0<=x<K-1时,
      d p [ x ] − d p [ x + 1 ] = ( d p [ x + 1 ] − d p [ x + W + 1 ] ) / W , ( 0 < = x < K − 1 ) dp[x]-dp[x+1] = (dp[x+1]-dp[x+W+1])/W ,(0<=x<K-1) dp[x]dp[x+1]=(dp[x+1]dp[x+W+1])/W,(0<=x<K1)

      d p [ x ] = d p [ x + 1 ] + ( d p [ x + 1 ] − d p [ x + W + 1 ] ) / W , ( 0 < = x < K − 1 ) dp[x] = dp[x+1]+(dp[x+1]-dp[x+W+1])/W ,(0<=x<K-1) dp[x]=dp[x+1]+(dp[x+1]dp[x+W+1])/W,(0<=x<K1)

      x=K-1时,
      d p [ K − 1 ] = ( d p [ K ] + d p [ K + 1 ] + . . . + d p [ K − 1 + W ] ) / W dp[K-1] = (dp[K]+dp[K+1]+...+dp[K-1+W])/W dp[K1]=(dp[K]+dp[K+1]+...+dp[K1+W])/W

      d p [ K − 1 ] = ( 1 ∗ ( m i n ( N , K + W − 1 ) − K + 1 ) + 0 + 0... + 0 ) / W dp[K-1] = (1 * (min(N,K+W-1)-K+1) +0+0...+0)/W dp[K1]=(1(min(N,K+W1)K+1)+0+0...+0)/W

      d p [ K − 1 ] = ( m i n ( N − K + 1 , W ) ) / W dp[K-1] = (min(N-K+1, W))/W dp[K1]=(min(NK+1,W))/W

class Solution {
    public double new21Game(int N, int K, int W) {
        if(K == 0){
            return 1.0;
        }
        double[] dp = new double[K+W+1];
        for(int i = K; i <= N && i <= K+W-1; i++){
            dp[i] = 1.0;
        }
        dp[K - 1] = 1.0 * Math.min(N-K+1, W) / W;
        for(int i = K-2; i >= 0; i--){
            dp[i] = dp[i+1] + (dp[i+1] - dp[i+1+W]) / W;
        }
        return dp[0];
    }
} 
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值