爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:
爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。
当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?
PS:
1. 0 <= K <= N <= 10000
2. 1 <= W <= 10000
3. 如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
4. 此问题的判断限制时间已经减少。
过去状态决定当前状态,所以用动态规划,用dp[i]表示当前手中牌为i时获胜(最终分数不超过N,也就是下一次抽到K(或不抽)且于当前相加小于N)的概率,开始时手中没牌即i=0
class Solution:
def new21Game(self, N: int, K: int, W: int) -> float:
dp = [0 for i in range(K + W)]
# 因为手中牌大于等于K就不抽了,所以先填充大于等于K的情况
for i in range(K, K + min(N - K + 1, W)):
dp[i] = 1 if i <= N else 0
dp[K - 1] = min(N - K + 1, W) / W
# 利用两项直接的差分倒推前面的值,减小运算成本
for i in range(K - 2, -1, -1):
dp[i] = dp[i + 1] - (dp [i + W + 1] - dp[i + 1]) / W
return dp[0]