[DP学习] 期望DP

一般思路

注:可以用方差求平方的期望

例题一

思路

重点:如何设状态,如何转移。

设状态 f[i] = i 张能买到不同卡片的种类数的期望值(直接对问题设置状态)

状态转移:由于从f[i+1]转移到 f[i] 时,我们得知道这次是否抽到的是新的卡片,所以,我们还得知道 f[i] 时的已抽到的卡片数。由于我们 f[i] 保存的就是买 i 张时,不同卡片数的期望值,所以不需要开第二维。

k-f[i] 为能买到新的卡片数量,则 (k-f[i])/k 为抽到新卡片的概率,所以状态转移为:f[i+1] = f[i] + (k-f[i])/k (疑惑:为什么是相加的,因为根据期望的性质,在 f[i+1] 的状态下,前 i 张的期望可以求,第 i+1 张就是新卡片的概率乘1,两个部分相加,就是 i+1 张的状态)

初始状态 f[1] = 1,这是一定的。

例题二

设状态 f[i] 为买 i 种卡片要买的卡片张数,

如果 p 是买到一张新卡片的概率,那么 1/p 就是买到新卡片需要的张数。(好像是这样的。。。我不会证明)

所以状态转移是:f[i+1] = f[i] + (k-i)/k

  • 10
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
期望dp和概率dp是两种不同的动态规划方法。 期望dp是指通过计算每个状态的期望值来求解最终的期望。在期望dp中,我们通常定义dp\[i\]表示在第i个状态时的期望值,然后通过状态转移方程来更新dp数组,最终得到最终状态的期望值。期望dp通常用于求解期望问题,例如求解骰子的期望点数、求解抽奖的期望次数等。 概率dp是指通过计算每个状态的概率来求解最终的概率。在概率dp中,我们通常定义dp\[i\]表示在第i个状态时的概率,然后通过状态转移方程来更新dp数组,最终得到最终状态的概率。概率dp通常用于求解概率问题,例如求解抛硬币出现正面的概率、求解从一副牌中抽到红心的概率等。 总结来说,期望dp和概率dp的区别在于它们所计算的是不同的值,期望dp计算的是期望值,而概率dp计算的是概率值。 #### 引用[.reference_title] - *1* [概率/期望dp专题](https://blog.csdn.net/qq_34416123/article/details/126585094)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [【动态规划】数学期望/概率DP/期望DP详解](https://blog.csdn.net/weixin_45697774/article/details/104274160)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值