期望DP

最新推荐文章于 2021-07-15 16:46:28 发布

Morning_Glory_JR

最新推荐文章于 2021-07-15 16:46:28 发布

阅读量1.4k

点赞数 4

分类专栏：理解 # 期望DP 竞赛算法文章标签：期望

本文链接：https://blog.csdn.net/Morning_Glory_JR/article/details/96731105

版权

竞赛算法同时被 3 个专栏收录

28 篇文章

订阅专栏

理解

17 篇文章

订阅专栏

期望DP

7 篇文章

订阅专栏

也许更好的阅读体验

文章目录

数学期望
- 符号
- 含义
转移方程
经典例题

数学期望

符号

$E = p * v$ 其中 $E$ 为期望， $v$ 为权值， $p$ 为概率

含义

期望表示多个可能事件的合理分配情况 ~~(本人自己的理解，不喜勿喷)~~
汉语期望意思是指人们对某样东西的提前勾画出的一种标准，达到了这个标准就是达到了期望值(百度百科)
数学期望也可认为是进行某件事能得到的平均结果，或者理想代价
期望值也许和每个得到值都 不相等
举个例子
你去买彩票，每张彩票 $10$ 元，中了奖可以得 $10000$ 元，有 $30\%$ 的概率中奖
我们来算一下买一张彩票的期望利润
首先有 $30\%$ 的概率中奖，根据定义期望得到 $30\%*10000$ 元
又有 $70\%$ 的概率不中奖，那么我们期望得到 $70\%*0$ 元
我们每次买一张彩票 $100$ 会花掉 $10$ 元
所以有 $E=30\%*10000+70\%*0-10=290$
我们可认为每买一张彩票赚了 $290$ 元
但是实际上无论怎样，一张彩票都不会赚 $290$ 元的。

转移方程

几种常见设转移方程数组的方法

设 $f [i]$ 表示的是由 $i$ 状态变成最终状态的期望
按照题意直接设
把选择的东西加入数组，如 $f [i] [j]$ 表示第 $i$ 个物品选 $j$ 个的期望或 $f [i] [j]$ 表示有 $i$ 个 $A$ 物品， $j$ 个 $B$ 物品的期望

求转移方程
应优先考虑进行操作后当前状态会怎么样，而不是如何变成当前状态，即先考虑逆向
如果逆向没有思路，则考虑正向

经典例题

注：没有贴出代码，有些题目现在找不到了 ~~(至少博主没有找到)~~，也有博主自己想的题目 ~~(很水)~~，如博主有写代码则已放进标题的链接里，那些链接都是题解，不是原题链接

SP1026FavoriteDice

题目大意

一个 $n$ 面的骰子，求期望掷几次能使得每一面都被掷到

解决方法

设 $f [i]$ 表示已经掷到过 $i$ 面，还期望掷多少次骰子使每一面都被掷到
现在掷一次骰子，有两种情况

有 $\frac{i}{n}$ 的概率掷到已经掷到过的面，此时仍然还要掷 $f [i]$ 次骰子
有 $\frac{n-i}{n}$ 的概率掷到没掷到过的面，此后就掷到过 $i + 1$ 个面了，还需掷 $f [i + 1]$ 次骰子

需要注意的是，无论是掷到以上哪种情况，都需要掷一次骰子
所以有
$f[i]=\frac{i}{n}f[i]+\frac{n-i}{n}f[i+1]+1$
将其化简
$f[i]=f[i+1]+\frac{n}{n-i}$

初值 $f [n] = 0$ ，答案为 $f [0]$
应逆向循环

涂格子/小孩和礼物

题目大意

有 $n$ 个格子，每次等概率随机给一个格子染色，问涂 $m$ 次后期望有多少格子被染色了

解决方法

设 $f [i]$ 表示涂 $i$ 次后期望有多少格子被染色了
现在进行第 $i$ 次染色，仍然有两种情况

有 $\frac{f[i-1]}{n}$ 的概率涂到已经涂过的格子
有 $\frac{n-f[i-1]}{n}$ 的概率涂到没涂过的格子

需要注意的是，无论是以上哪种，都已经有 $f [i - 1]$ 个格子被染色了
所以有
$f[i]=\frac{f[i-1]}{n}·0+\frac{n-f[i-1]}{n}·1+f[i-1]$
将其化简
$f[i]=\frac{n-f[i-1]}{n}+f[i-1]=\frac{n-1}{n}f[i-1]+1$
此时该式就是一个等差数列套等比数列
于是我们可以求其通项公式，博主懒得求了写下大致过程

令 $k=\frac{n-1}{n}$
$f_n=kf_{n-1}+1$
$f_n+\frac{1}{k-1}=kf_{n-1}+\frac{k}{k-1}$
$f_n+\frac{1}{k-1}=k(f_{n-1}+\frac{1}{k-1})$
令 $g_n=f_n+\frac{1}{k-1}$
则 $g_n=kg_{n-1}$
怎么求 $g_n$ 就不用说了吧
$f_n=g_n-\frac{1}{k-1}$
$f_n$ 也能求出来了

初值 $f [0] = 0 ∣ f [1] = 1$ 答案为 $f [m]$
应正向循环

简单题

题目大意

桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。

解决方法

设 $f [i] [j]$ 表示有 $i$ 张红牌， $j$ 张黑牌的期望收益
考虑翻一张牌，还是有两种情况

有 $\frac{i}{i+j}$ 的概率翻到红牌，此后就只有 $i - 1$ 张红牌， $j$ 张黑牌
有 $\frac{j}{i+j}$ 的概率翻到黑牌，此后就只有 $i$ 张红牌， $j - 1$ 张黑牌

需要注意的是，不要忘了翻开的牌的贡献
翻开一张牌后，该颜色牌数目就少了一张

所以有
$f[i][j]=\frac{i}{i+j}(f[i-1][j]+1)+\frac{j}{i+j}(f[i][j-1]-1)$
由于是最优策略，所以咱是不可能赔钱的
$f[i][j]=max(0,\frac{i}{i+j}(f[i-1][j]+1)+\frac{j}{i+j}(f[i][j-1]-1))$

初值 $f [0] [1] = 0, f [i] [0] = i$ ，答案为 $f [R] [B]$
应正向循环

亚瑟王

题目大意

给出 $n$ 个技能，每个技能按输入顺序有 $p [i]$ 的概率释放并造成 $d [i]$ 的伤害。每轮游戏从前往后顺序查看每个技能，若技能发动过则跳过，没发动过则以 $p [i]$ 的技能发动，即每个技能只能发动一次，若将一个技能发动，则进行下一轮游戏，没有成功发动或被跳过就查看下一个技能，一轮游戏可能每个技能都不发动，问 $r$ 轮游戏一共能造成的伤害期望。

解决方法

因为有一个顺序查看的限制，没有后效性的状态是十分不好设的，因为不知道前面有几个技能发动了，若一个技能前面的技能在某轮发动了，则该技能本轮一定不能发动，若前面有些技能发动过，则它们都会被跳过
为了解决这种情况，我们设状态时试着强制限制技能发动（ $n r$ 枚举情况），当然，设的状态仍然要满足所有情况都考虑在内
设 $f [i] [j]$ 表示对前 $i$ 个技能进行了 $j$ 轮游戏发生的概率
若前 $i$ 个技能进行了 $j$ 轮游戏
则有 $j$ 轮不会考虑第 $i + 1$ 个技能
即有 $r - j$ 轮游戏选择了 $i$ 之后的技能
此时考虑第 $i + 1$ 个技能的情况，分为两种

有 $p[i+1]^{r-j}$ 的概率 $i + 1$ 号技能从未发动
有 $1-p[i+1]^{r-j}$ 的概率 $i + 1$ 号技能发动过

需要注意的是，此时已经确定前 $i$ 个技能进行并 只进行 了 $j$ 轮游戏，其概率应该也计算在内
所以有

$f[i+1][j]+=1-p[i+1]^{r-j}f[i][j]$
$f[i+1][j+1]+=(1-p[i+1]^{r-j})f[i][j]$

$j + 1$ 要小于等于 $r$

初值 $f [0] [0] = 1$ ，答案在中途计算
应正向循环

计算了概率，别忘了求的是期望伤害，在求概率的时候顺便用概率乘以伤害

抽卡

题目大意

$\mathcal{Morning\_Glory}$ 最近迷上了抽卡，每次抽卡抽到 $6$ 星卡的概率为 $p$ 。抽卡活动进行 $n$ 天， $\mathcal{Morning\_Glory}$ 非常喜欢抽卡，所以他不会错过这个活动的每一天，即每天都一定会抽卡，在第 $i$ 天必须要花 $c [i]$ 游戏币进行抽卡。求 $\mathcal{Morning\_Glory}$ 在活动结束时抽得恰好 $k$ 张 $6$ 星卡的期望游戏币花费。

解决方法

设 $f [i] [j]$ 表示在第 $i$ 天结束后抽到 $j$ 张 $6$ 星卡的期望游戏币花费
在第 $i$ 天进行抽卡，有两种情况

有 $p$ 的概率抽到 $6$ 星卡
有 $1 - p$ 的概率没抽到 $6$ 星卡

需要注意的是无论是否翻到，都要花费
所以有
$f [i] [j] = p \cdot f [i - 1] [j - 1] + (1 - p) \cdot f [i - 1] [j] + c [i]$

初值 $f [0] [0] = 0$ ，答案为 $f [n] [k]$
应正向循环

收集邮票

[POJ3682]King_Arthur’s_Birthday_Celebration

这两题是一样的类型，只有概率与计算答案要改一下，这里用收集邮票来做例题
题目大意

有 $n$ 种邮票，每天等概率的买一张邮票，第 $i$ 天购买要花费 $i$ 元，求收集 $n$ 种邮票的期望花费

解决方法

先设 $f [i]$ 表示买到 $i$ 种邮票后，离买到 $n$ 种邮票的期望还差天数
和最上面那题一样的处理方法
考虑当前买了 $i$ 张邮票，再买一张邮票，有两种情况

有 $\frac{i}{n}$ 的概率买到重复的邮票，此时仍只买到 $i$ 张邮票
有 $\frac{n-i}{n}$ 的概率买到没买过的邮票，此后就已买到 $i + 1$ 张邮票

需要注意的是，无论哪种情况，都过了一天
所以有
$f[i]=\frac{i}{n}f[i]+\frac{n-i}{n}f[i+1]+1$
将其化简
$f[i]=f[i+1]+\frac{n}{n-i}$

初值 $f [n] = 0$ ，答案为 $f [0]$
应逆向循环

当然这只是期望天数，不是期望花费
设 $g [i]$ 表示拥有(不是买) $i$ 种邮票，买到 $n$ 种邮票的期望花费
考虑当前拥有了 $i$ 张邮票，买一张邮票，有两种情况

有 $\frac{i}{n}$ 的概率买到重复的邮票，此时仍只拥有 $i$ 种
有 $\frac{n-i}{n}$ 的概率买到没买过的邮票，此后就已拥有 $i + 1$ 张邮票

需要注意的是，无论哪种情况，都买了一张邮票
此时我们不知道每张邮票多少钱
但我们知道每张邮票和过了多少天有关
这次的注意写在前面，我们是认为有了 $i$ 张邮票后才开始，所以第一天邮票价格为 $1$ 元
为什么这么设？
我们不知道也不好处理出前面买了多少张邮票，再买到一张邮票要多少钱
但是我们知道第一天肯定是只要 $1$ 元的，答案为 $g [0]$ ，中间的过程不重要，只需推出最终答案
我们借助初始状态的这条非常有用的性质于是就设出了这样的 $g$
这样我们可以知道

若买到重复的邮票，我们知道，因为是设当前是第一天，所以原本希望买到的邮票的天数又往后推了一天，所以总价格要多 $f [i]$ 元，还要加上自己的 $1$ 元
若买到没买过的邮票，同理，因为后面的 $g [i + 1]$ 也是从第 $1$ 天开始考虑的，所以原本希望买到的邮票数也往后推了一天，所以价格要多 $f [i + 1]$ 元，还要加上自己的 $1$ 元