【数学期望】期望dp

这篇博客主要介绍了如何使用期望动态规划(dp)解决一系列问题,通过递推方式解析并给出多个例题的详细解答和代码实现,包括抛硬币问题、利润预期、涂格子问题等,展示如何进行期望的顺推与逆推。
摘要由CSDN通过智能技术生成

参考博客: https://www.zybuluo.com/zsh-o/note/1175045
此类问题,一般用递推的思想去考虑比较简单。跟普通的dp差不多,前面的子问题可以重复使用。
在这里插入图片描述

例题1

https://ac.nowcoder.com/acm/contest/697/A

题解

这个题其实就是抛硬币连续k次正面的变形。
在还没看博客之前做着题的时候,我想的是,走到第i个点需要1秒的期望,2秒的期望,3秒的期望,4秒的期望。。。。。
会发现这个根本就不可做。如果每颗雷的概率相同的话,还能用错位相减推出通项公式。

可以采用递推的方式:
f[i] : 成功排掉第i颗雷所需的期望时间
递推关系:
f [ i ] = a i b i ( f [ i − 1 ] + 1 ) + ( 1 − a i b i ) ( f [ i − 1 ] + 1 + f [ i ] ) f[i] = \frac{a_i}{b_i}(f[i-1]+1)+(1-\frac{a_i}{b_i})(f[i-1]+1+f[i]) f[i]=biai(f[i1]+1)+(1biai)(f[i1]+1+f[i])
成功排掉第i颗雷+不成功需要重新排
化简之后
f [ i ] = b i a i ( f [ i − 1 ] + 1 ) f[i] = \frac{b_i}{a_i}(f[i-1]+1) f[i]=aibi(f[i1]+1)

代码

#include <bits/stdc++.h>
using namespace std;
// f[i] : 成功排掉第i个雷的期望时间
// f[i] = a/b*(f[i-1]+1)+(1-a/b)*(f[i-1]+1+f[i])
// f[i] = b/a*(f[i-1]+1);
const int mod = 1e9+7;
const int maxn = 1e6+5;
typedef long long ll;
ll pw(ll x, ll n) {
   
    ll ret = 1;
    while(n) {
   
        if(n&1) ret = ret*x%mod;
        x = x*x%mod;
        n >>= 1;
    }
    return ret;
}
ll f[maxn];

int main() {
   
    int n;
    scanf("%d", 
期望dp和概率dp是两种不同的动态规划方法。 期望dp是指通过计算每个状态的期望值来求解最终的期望。在期望dp中,我们通常定义dp\[i\]表示在第i个状态时的期望值,然后通过状态转移方程来更新dp数组,最终得到最终状态的期望值。期望dp通常用于求解期望问题,例如求解骰子的期望点数、求解抽奖的期望次数等。 概率dp是指通过计算每个状态的概率来求解最终的概率。在概率dp中,我们通常定义dp\[i\]表示在第i个状态时的概率,然后通过状态转移方程来更新dp数组,最终得到最终状态的概率。概率dp通常用于求解概率问题,例如求解抛硬币出现正面的概率、求解从一副牌中抽到红心的概率等。 总结来说,期望dp和概率dp的区别在于它们所计算的是不同的值,期望dp计算的是期望值,而概率dp计算的是概率值。 #### 引用[.reference_title] - *1* [概率/期望dp专题](https://blog.csdn.net/qq_34416123/article/details/126585094)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [【动态规划】数学期望/概率DP/期望DP详解](https://blog.csdn.net/weixin_45697774/article/details/104274160)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值