DailyChallenge
837. 新21点
Medium
20200603
Description
爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:
爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。
当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?
示例1:
输入:N = 10, K = 1, W = 10
输出:1.00000
说明:爱丽丝得到一张卡,然后停止。
示例2:
输入:N = 6, K = 1, W = 10
输出:0.60000
说明:爱丽丝得到一张卡,然后停止。
在 W = 10 的 6 种可能下,她的得分不超过 N = 6 分。
示例3:
输入:N = 21, K = 17, W = 10
输出:0.73278
提示:
0 <= K <= N <= 10000
1 <= W <= 10000
如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
此问题的判断限制时间已经减少。
Solution
动态规划
以下称分数不超过 N
为获胜
。 爱丽丝获胜的概率只和下一轮开始前的得分有关,因此根据得分计算概率。
-
状态:令
dp[x]
表示从得分为x
的情况开始游戏并且获胜的概率,目标是求dp[0]
的值。 -
边界情况:
- 可以达到的最大分数:
K-1+W
(最后一次抽前分数为K-1,最后抽到了W) K≤x≤min(N,K-1+W)
时,dp[x]=1
x>min(N,K-1+W)
时,dp[x]=0
- 可以达到的最大分数:
-
状态转移方程
0≤x<K
时,状态怎么转移?参考-
d p [ x ] = ( d p [ x + 1 ] + d p [ x + 2 ] + . . . + d p [ x + W ] ) / W dp[x] = (dp[x+1]+dp[x+2]+...+dp[x+W])/W dp[x]=(dp[x+1]+dp[x+2]+...+dp[x+W])/W
-
简化:
0<=x<K-1
时,
d p [ x ] − d p [ x + 1 ] = ( d p [ x + 1 ] − d p [ x + W + 1 ] ) / W , ( 0 < = x < K − 1 ) dp[x]-dp[x+1] = (dp[x+1]-dp[x+W+1])/W ,(0<=x<K-1) dp[x]−dp[x+1]=(dp[x+1]−dp[x+W+1])/W,(0<=x<K−1)d p [ x ] = d p [ x + 1 ] + ( d p [ x + 1 ] − d p [ x + W + 1 ] ) / W , ( 0 < = x < K − 1 ) dp[x] = dp[x+1]+(dp[x+1]-dp[x+W+1])/W ,(0<=x<K-1) dp[x]=dp[x+1]+(dp[x+1]−dp[x+W+1])/W,(0<=x<K−1)
x=K-1
时,
d p [ K − 1 ] = ( d p [ K ] + d p [ K + 1 ] + . . . + d p [ K − 1 + W ] ) / W dp[K-1] = (dp[K]+dp[K+1]+...+dp[K-1+W])/W dp[K−1]=(dp[K]+dp[K+1]+...+dp[K−1+W])/Wd p [ K − 1 ] = ( 1 ∗ ( m i n ( N , K + W − 1 ) − K + 1 ) + 0 + 0... + 0 ) / W dp[K-1] = (1 * (min(N,K+W-1)-K+1) +0+0...+0)/W dp[K−1]=(1∗(min(N,K+W−1)−K+1)+0+0...+0)/W
d p [ K − 1 ] = ( m i n ( N − K + 1 , W ) ) / W dp[K-1] = (min(N-K+1, W))/W dp[K−1]=(min(N−K+1,W))/W
-
class Solution {
public double new21Game(int N, int K, int W) {
if(K == 0){
return 1.0;
}
double[] dp = new double[K+W+1];
for(int i = K; i <= N && i <= K+W-1; i++){
dp[i] = 1.0;
}
dp[K - 1] = 1.0 * Math.min(N-K+1, W) / W;
for(int i = K-2; i >= 0; i--){
dp[i] = dp[i+1] + (dp[i+1] - dp[i+1+W]) / W;
}
return dp[0];
}
}