概率DP/期望DP总结

概述

一般来说,概率DP找到正确的状态定义后,转移是比较容易想到的。但状态一定是“可数”的,把有范围的整数作为数组下标。事实上,将问题直接作为状态是最好的。如问“n人做XX事的期望次数”,则设计状态为f[i]表示i个人做完事的期望。转移一般是递推,即从上一个状态转移得(填表)或转移向下一个状态(刷表)。

有时期望DP需以最终状态为初始状态转移,即逆推。如f[i]表示期望还要走f[i]步到达终点。这种状态的转移是刷表法,形如 f [ i ] = ∑ p [ i → j ] f [ j ] + w [ i → j ] f[i]=\sum p[i\rightarrow j]f[j]+w[i\rightarrow j] f[i]=p[ij]f[j]+w[ij],其中 p [ ] p[] p[]表示转移的概率, w [ ] w[] w[]表示转移对答案的贡献。一般来说,初始状态确定时可用顺推,终止状态确定时可用逆推。

练习题

涂格子1

n个格子,每次随机涂一个,求涂满m个格子的期望次数。

如概述所说,因为最终状态确定,使用逆推。设计状态 f [ i ] f[i] f[i]表示涂了 i i i个格子,到涂满 m m m个格子还要涂的期望次数。初始状态是 f [ m ] = 0 f[m]=0 f[m]=0。转移时考虑 f [ i ] f[i] f[i]是怎么来的,有 i n \frac{i}{n} ni的概率由“涂到涂过的格子”转移来,即由 f [ i ] f[i] f[i]转移来;另有 n − i n \frac{n-i}{n} nni的概率由“涂到没涂过的格子”转移来,即由 f [ i + 1 ] f[i+1] f[i+1]来。并且无论从哪里来,这次的期望次数都比原来的期望次数多 1 1 1。于是转移方程为 f [ i ] = i n f [ i ] + n − i n f [ i + 1 ] + 1 ( i &lt; m ) f[i]=\frac{i}{n}f[i]+\frac{n-i}{n}f[i+1]+1(i&lt;m) f[i]=nif[i]+nnif[i+1]+1(i<m)

涂格子2

n个格子,每次随机涂一个,求涂m次后期望涂色格子数。

如概述所说,设计状态f[i]表示涂i次后的答案。转移时考虑这次是涂了的还是没涂的。转移方程为 f [ i ] = n − f [ i − 1 ] n + f [ i − 1 ] f[i]=\frac{n-f[i-1]}{n}+f[i-1] f[i]=nnf[i1]+f[i1]

另外,可证明 f [ n ] = n ⋅ ( 1 − ( n − 1 n ) m ) f[n]=n\cdot(1-(\frac{n-1}{n})^m) f[n]=n(1(nn1)m)

涂格子3

n n n个格子,每次会涂一个格子,其中涂第 i i i个格子的概率是 p i p_i pi(保证 ∑ p i \sum p_i pi=1)。求每个格子都被涂色的期望次数。

因为涂到每个格子的概率不同,所以没法把“格子数量”当成一维状态,只能使用状压。设 f [ S ] f[S] f[S]表示涂格子的状态(二进制表示)为 S S S时到涂满还需要的次数。则初始状态为 f [ 2 n − 1 ] = 0 f[2^n-1]=0 f[2n1]=0,转移时枚举涂哪个格子即可,具体方程为 f [ S ] = ∑ i = 0 n − 1 p i f [ S  or  2 i ] + 1 f[S]=\sum_{i=0}^{n-1}p_if[S\text{ or }2^i]+1 f[S]=i=0n1pif[S or 2i]+1

小孩和礼物

n n n个礼物盒和 m m m个小孩,每个盒子里有一个礼物。所有人轮流开盒子,每次打开一个随机盒子,如果里面有礼物就拿走(如果被开过了就没有礼物了)。问所有人拿走礼物的期望数量。

一个礼物=一个打开过的盒子。f[i]表示i个人拿走礼物的期望,相当于表示涂i次期望涂色格子数量。同涂格子2。

麻球繁衍

开始有n个麻球,每天每个麻球会死亡,同时繁衍出若干新麻球。每个麻球繁衍i个麻球的概率是 p [ i ] ( 0 ≤ i &lt; k ) p[i](0\le i&lt; k) p[i](0i<k)。求在m天内麻球死绝的概率。

每个麻球是互相独立的,设计状态f[i]表示一个麻球i天内死绝的概率,则n个麻球在i天内死亡的概率是 f [ i ] n f[i]^n f[i]n。转移时考虑这个麻球第一天繁衍多少个,它们在接下来的 i − 1 i-1 i1天内死绝了。转移方程为 f [ i ] = ∑ j = 0 k − 1 p [ j ] f [ i − 1 ] j f[i]=\sum_{j=0}^{k-1}p[j]f[i-1]^j f[i]=j=0k1p[j]f[i1]j

亚瑟王的生日庆典

亚瑟王过生,他每天抛一枚硬币,正面向上的概率是 p p p。办庆典要花钱,在第 i i i天要花 ( 2 i − 1 ) (2i-1) (2i1)千元。求正面向上数 ≥ k \ge k k次时的期望花钱数。

f[i]表示正面向上i次的期望花钱。转移时考虑是否掷到正面,容易列出转移 f [ i ] = ( 1 − p ) f [ i ] + p f [ i − 1 ] + 正 面 向 上 i 次 当 天 期 望 花 费 f[i]=(1-p)f[i]+p f[i-1]+正面向上i次当天期望花费 f[i]=(1p)f[i]+pf[i1]+i
需要计算g[i]表示正面向上i次的期望天数,则当天期望开销= 2 × g [ i ] − 1 2\times g[i]-1 2×g[i]1 g [ i ] = ( 1 − p ) g [ i ] + p g [ i − 1 ] + 1 g[i]=(1-p)g[i]+pg[i-1]+1 g[i]=(1p)g[i]+pg[i1]+1

BZOJ4318 OSU!

开始有一个空串,每次添加一个0或1,添加1的概率为 p p p。添加完后计算得分,每一段连续极长1段贡献 l e n 3 len^3 len3分。求最后期望得分。

转移时考虑是否增加1,如果增加了一个1,设当前期望连续1个数为 l l l,那么答案应该增加 ( l + 1 ) 3 − l 3 (l+1)^3-l^3 (l+1)3l3。因此还需要维护 l l l l 2 l^2 l2的期望。维护 l 2 l^2 l2时同样考虑答案增加多少。

循环转移处理方法

有些DP方程之间会循环转移。可以高斯消元,或者设每个状态为形如 f [ u ] = a [ u ] f [ f a ] + b [ u ] f [ 0 ] + c [ u ] f[u]=a[u]f[fa]+b[u]f[0]+c[u] f[u]=a[u]f[fa]+b[u]f[0]+c[u],最后求出所有系数。

例题

单人博弈

有三个正多面体骰子,第i个有k[i]面。每次扔全部三个骰子,得到等同于它们的和的分数。如果三个骰子分别掷得a、b、c,则得分清零。求得分≥n时的期望次数。

设f[i]表示得i分的期望次数。转移时考虑三个骰子的和,先算出p[i]表示和为i的概率,p0表示得分清零的概率。用刷表法,转移方程为 f [ i ] = ∑ k p [ k ] f [ i + k ] + p 0 ∗ f [ 0 ] + 1 f[i]=\sum_kp[k]f[i+k]+p_0*f[0]+1 f[i]=kp[k]f[i+k]+p0f[0]+1
我们看到,转移方程是与 f [ 0 ] f[0] f[0]有关的。设 f [ i ] = a [ i ] f [ 0 ] + b [ i ] f[i]=a[i]f[0]+b[i] f[i]=a[i]f[0]+b[i],则可以解出 a [ i ] a[i] a[i] b [ i ] b[i] b[i]

迷宫

给定一棵 n n n个点的树,开始你在根节点,在结点 u u u上时有 k i l l [ u ] kill[u] kill[u]的概率去根节点, e s c a p e [ u ] escape[u] escape[u]的概率结束,剩下的概率随机到一个与 u u u相邻的点。求结束时期望经过的边数。

考虑逆推, f [ i ] f[i] f[i]表示在 i i i结点到结束期望的边数。
对叶子节点有 f [ u ] = k i l l [ u ] f [ 0 ] + e s c a p e [ u ] × 0 + ( 1 − k i l l [ u ] − e s c a p e [ u ] ) ( f [ f a [ u ] ] + 1 ) f[u]=kill[u]f[0]+escape[u]\times 0+(1-kill[u]-escape[u])(f[fa[u]]+1) f[u]=kill[u]f[0]+escape[u]×0+(1kill[u]escape[u])(f[fa[u]]+1)
对非叶子节点有 f [ u ] = k i l l [ u ] f [ 0 ] + e s c a p e [ u ] × 0 + 1 − k i l l [ u ] − e s c a p e [ u ] d e g [ u ] ⋅ ( f [ f a [ u ] ] + ∑ v = s o n [ u ] [ ] f [ v ] ) f[u]=kill[u]f[0]+escape[u]\times 0+\frac{1-kill[u]-escape[u]}{deg[u]}\cdot(f[fa[u]]+\sum_{v=son[u][]}f[v]) f[u]=kill[u]f[0]+escape[u]×0+deg[u]1kill[u]escape[u](f[fa[u]]+v=son[u][]f[v])
用待定系数法,设 f [ u ] = a [ u ] f [ 0 ] + b [ u ] f [ f a [ u ] ] + c [ u ] f[u]=a[u]f[0]+b[u]f[fa[u]]+c[u] f[u]=a[u]f[0]+b[u]f[fa[u]]+c[u],代入上面式子的 f [ v ] f[v] f[v],解得参数。先从下到上计算参数的值,再从上到下计算答案。

  • 49
    点赞
  • 141
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值