动态规划_medium_1230_抛掷硬币

题目描述

有一些不规则的硬币。在这些硬币中,prob[i] 表示第 i 枚硬币正面朝上的概率。

请对每一枚硬币抛掷 一次,然后返回正面朝上的硬币数等于 target 的概率。

示例 1:

输入:prob = [0.4], target = 1
输出:0.40000

示例 2:

输入:prob = [0.5,0.5,0.5,0.5,0.5], target = 0
输出:0.03125

提示:

  • 1 <= prob.length <= 1000
  • 0 <= prob[i] <= 1
  • 0 <= target <= prob.length
  • 如果答案与标准答案的误差在 10^-5 内,则被视为正确答案。

思路

注:该问题类似与背包问题的思路

令 dp[i, j] 表示前i个硬币,j个面朝上的概率

  • 将原问题 转成一个如下子问题:
    假设 前 n 0 , n 1 , . . . n i n_0, n_1, ... n_i n0,n1,...ni 枚硬币,有 j j j 枚正面朝上的概率是 d p [ i , j ] dp[i, j] dp[i,j] , 这里的 j < = i j <= i j<=i。则可以氛围两种情况:

    • n i n_i ni 枚硬币 正面朝上,则前 n 0 , n 1 , . . . n i − 1 n_0, n_1, ... n_{i-1} n0,n1,...ni1 枚中有 j − 1 j-1 j1枚硬币朝上,概率为 d p [ i − 1 , j − 1 ] dp[i-1, j-1] dp[i1,j1]
    • n i n_i ni 枚硬币 反面朝上,则前 n 0 , n 1 , . . . n i − 1 n_0, n_1, ... n_{i-1} n0,n1,...ni1 枚中有 j j j枚硬币朝上,概率为 d p [ i − 1 , j − 1 ] dp[i-1, j-1] dp[i1,j1]
  • 对于上面的第一种情况,发生的概率是 p r o b [ i ] prob[i] prob[i],第二种情况发生的概率是 1 − p r o b [ i ] 1-prob[i] 1prob[i]。故状态转移方程为:
    d p [ i , j ] = ( 1 − p r o b [ i ] ) ∗ d p [ i − 1 , j ] + p r o b [ i ] ∗ d p [ i − 1 , j − 1 ] dp[i, j] = (1-prob[i])*dp[i-1, j] + prob[i]*dp[i-1, j-1] dp[i,j]=(1prob[i])dp[i1,j]+prob[i]dp[i1,j1]

  • python代码如下:

from typing import List
class Solution:
    def probabilityOfHeads(self, prob: List[float], target: int) -> float:
        dp = [[0]* (target+1) for _ in range(len(prob))]
        # target 为 0时,即所有硬币都是反面
        # 这时的状态转移方程为 dp[i,0] = (1-prob[i])*dp[i-1,0] -- 第一列, 表示正面朝上数为0
        # 且 dp[0, 0] = 1 - prob[0]
        dp[0][0] = 1 - prob[0]
        for i in range(1, len(prob)):
            dp[i][0] = (1-prob[i])*dp[i-1][0]
        
        if target:  # 正面向上的数量不为0
            dp[0][1] = prob[0]  # 前1个硬币 有 1个面向上

        for i in range(1, len(prob)):  # 从第二行开始, 即第2个硬币
            for j in range(1, target+1):  # 从第二列开始, 即1个面向上
                dp[i][j] = (1-prob[i])*dp[i-1][j] + prob[i]*dp[i-1][j-1]
        
        return dp[-1][-1]
  • 空间复杂度可以优化成一维:
class Solution:
    def probabilityOfHeads(self, prob: List[float], target: int) -> float:
        dp = [1]
        for i in range(len(prob)):
            coin = prob[i]
            if i <= target: dp.append(dp[-1] * coin)
            for i in range(min(target, len(dp)-2), 0, -1):
                dp[i] = dp[i] * (1 - coin) + dp[i-1] * coin
            dp[0] = dp[0] * (1-coin)
        return dp[target]
  • 时间复杂度 O ( m n ) O(mn) O(mn),m 为 硬币数量,n是正面朝上的数量。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值