题目描述
有一些不规则的硬币。在这些硬币中,prob[i] 表示第 i 枚硬币正面朝上的概率。
请对每一枚硬币抛掷 一次,然后返回正面朝上的硬币数等于 target 的概率。
示例 1:
输入:prob = [0.4], target = 1
输出:0.40000
示例 2:
输入:prob = [0.5,0.5,0.5,0.5,0.5], target = 0
输出:0.03125
提示:
- 1 <= prob.length <= 1000
- 0 <= prob[i] <= 1
- 0 <= target <= prob.length
- 如果答案与标准答案的误差在 10^-5 内,则被视为正确答案。
思路
注:该问题类似与背包问题的思路
令 dp[i, j] 表示前i个硬币,j个面朝上的概率
-
将原问题 转成一个如下子问题:
假设 前 n 0 , n 1 , . . . n i n_0, n_1, ... n_i n0,n1,...ni 枚硬币,有 j j j 枚正面朝上的概率是 d p [ i , j ] dp[i, j] dp[i,j] , 这里的 j < = i j <= i j<=i。则可以氛围两种情况:- 第 n i n_i ni 枚硬币 正面朝上,则前 n 0 , n 1 , . . . n i − 1 n_0, n_1, ... n_{i-1} n0,n1,...ni−1 枚中有 j − 1 j-1 j−1枚硬币朝上,概率为 d p [ i − 1 , j − 1 ] dp[i-1, j-1] dp[i−1,j−1] 。
- 第 n i n_i ni 枚硬币 反面朝上,则前 n 0 , n 1 , . . . n i − 1 n_0, n_1, ... n_{i-1} n0,n1,...ni−1 枚中有 j j j枚硬币朝上,概率为 d p [ i − 1 , j − 1 ] dp[i-1, j-1] dp[i−1,j−1]
-
对于上面的第一种情况,发生的概率是 p r o b [ i ] prob[i] prob[i],第二种情况发生的概率是 1 − p r o b [ i ] 1-prob[i] 1−prob[i]。故状态转移方程为:
d p [ i , j ] = ( 1 − p r o b [ i ] ) ∗ d p [ i − 1 , j ] + p r o b [ i ] ∗ d p [ i − 1 , j − 1 ] dp[i, j] = (1-prob[i])*dp[i-1, j] + prob[i]*dp[i-1, j-1] dp[i,j]=(1−prob[i])∗dp[i−1,j]+prob[i]∗dp[i−1,j−1] -
python代码如下:
from typing import List
class Solution:
def probabilityOfHeads(self, prob: List[float], target: int) -> float:
dp = [[0]* (target+1) for _ in range(len(prob))]
# target 为 0时,即所有硬币都是反面
# 这时的状态转移方程为 dp[i,0] = (1-prob[i])*dp[i-1,0] -- 第一列, 表示正面朝上数为0
# 且 dp[0, 0] = 1 - prob[0]
dp[0][0] = 1 - prob[0]
for i in range(1, len(prob)):
dp[i][0] = (1-prob[i])*dp[i-1][0]
if target: # 正面向上的数量不为0
dp[0][1] = prob[0] # 前1个硬币 有 1个面向上
for i in range(1, len(prob)): # 从第二行开始, 即第2个硬币
for j in range(1, target+1): # 从第二列开始, 即1个面向上
dp[i][j] = (1-prob[i])*dp[i-1][j] + prob[i]*dp[i-1][j-1]
return dp[-1][-1]
- 空间复杂度可以优化成一维:
class Solution:
def probabilityOfHeads(self, prob: List[float], target: int) -> float:
dp = [1]
for i in range(len(prob)):
coin = prob[i]
if i <= target: dp.append(dp[-1] * coin)
for i in range(min(target, len(dp)-2), 0, -1):
dp[i] = dp[i] * (1 - coin) + dp[i-1] * coin
dp[0] = dp[0] * (1-coin)
return dp[target]
- 时间复杂度 O ( m n ) O(mn) O(mn),m 为 硬币数量,n是正面朝上的数量。