参考资料
看到期望经过次数的说法:https://blog.csdn.net/bzjr_Log_x/article/details/100007360
你谷题解:https://www.luogu.com.cn/blog/Kelin/solution-p3706
期望经过次数和概率在无向图之间的联系
是不是看到这个头都要爆炸了。
前言
也许许多时候你总是会看到一些题目,问你最终概率,但是其转移过程是无向图的,这个时候,高斯消元大爷肯定是不二之选。(至少我现在还没有看到哪个无向图概率题是不用高斯消元的)
正片
现在给你一个这样的无向图:
我们从
0
0
0号点出发,走到
1
1
1的概率是多少(走到
1
1
1就停),
50
%
50\%
50%停留在原地,也许你会直接说,这不就是
1
1
1吗。
但是如果要你列出概率方程,额。。。。
设 f [ i ] f[i] f[i]为到达这个点的概率,然后 f [ 1 ] = 1 2 f [ 0 ] f[1]=\frac{1}{2}f[0] f[1]=21f[0]?
但是 f [ 0 ] f[0] f[0]的概率为 0 0 0,总么可能转移的了啊。
这个时候,我们终于发现了一个事情,因为概率这个东西更加反映的是结果,即各个随机事件之间所发生样本个数和总样本个数间的比例,其对于中间过程十分不友好,因为中间过程也许根本连样本个数都没有。
于是统计其概率就成了一个十分玄乎的事情。不就是1吗
事实上,当然对于这个图也存在微积分的方法,但是当点数很多,终点很多,微积分也许就不是一个好主意了。
但是,这个时候,我们引入一个新的东西,点的期望经过次数,这个就对于中间点十分的友好,因为其中间点也可以有确定的数值,那么如何统计呢?对于一个点 x x x,如果存在一条路径可以到 x x x(假设这个时候突然停下来等一等,毕竟 x x x不是终点,后面还会继续跑),那么就把这条路径现在的概率乘 1 1 1加到 e [ x ] e[x] e[x]中( e [ x ] e[x] e[x]表示期望经过次数),当然,一条路径可能经过 x x x多次,因此当一条路径经过 x x x时,其可能已经经过 x x x好几次了。
当然,这也是个无限的东西,他是否是收敛的,我并不会证,但是用高斯消元一样可以求得,后面会讲。
最神奇的一件事情是, e [ e d ] e[ed] e[ed]就等于 e d ed ed的概率。( e d ed ed可能有多个)
仔细观察就会发现, e [ e d ] e[ed] e[ed]的定义刚好就是 e d ed ed的概率的定义(或者说是经典求法),此时我们前文括号里说停下来等一等就是永远停下来了,因为到了 e d ed ed就停下来。
发现了这个美妙的性质,无向图的概率题基本上都可以用期望经过次数来搞了。
无向图的期望问题
本文无法保证正确性
事实上,期望无非是列个式子,高斯消元。
期望经过次数
本文先讲如何求期望经过次数。
需要严重注意的事情是:实际上,期望的转移过程不能但看几个变量间存在概率关系就直接乘上概率转移,因为期望在无向图上之所以有最终答案是因为无限是可以通过求极限得到确值的,比如:期望次数,其只是一坨式子的结果,你不能单单把这个当成次数来耍除非你是老手。在后文,就会举一个错误示范。当然,许多用法都是可以证明是对的,比如下文提到的把边的期望经过次数转换为两端点的期望经过次数。
好,扯了这么多,关键是次数怎么求你是一句话也没讲啊。这不就来讲了吗。
首先,设 E ( x ) E(x) E(x)为到 x x x的期望经过次数, E d g e Edge Edge为边集, p ( x , y ) p(x,y) p(x,y)为经过这条边的概率(当然,有时候 x , y x,y x,y走这条边的概率可能不相同,因此 p ( x , y ) ≠ p ( y , x ) p(x,y)≠p(y,x) p(x,y)=p(y,x)),那么 E ( y ) = ∑ ( x , y ) ∈ E d g e , x ≠ e d E ( x ) p ( x , y ) E(y)=\sum\limits_{(x,y)∈Edge,x≠ed}E(x)p(x,y) E(y)=(x,y)∈Edge,x=ed∑E(x)p(x,y)。
现在证明在期望具体式子中也是对的。
设存在一条从起点到 x x x并且停下来一下的路径 T T T,其目前的概率为 S S S,然后其转移到 y y y的概率为 p ( x , y ) p(x,y) p(x,y),那么显然 T + y T+y T+y(就是路径又多了个 y y y)的概率就是 S ∗ p ( x , y ) S*p(x,y) S∗p(x,y),因为 T T T不重复,所以 T + y T+y T+y也不重复,概率就是所有加起来,也就是 E ( x ) ∗ p ( x , y ) E(x)*p(x,y) E(x)∗p(x,y)。
但是,比较特殊的, E ( 1 ) + = 1 E(1)+=1 E(1)+=1,因为从起点出发,必须经过。
而这个统计期望经过次数的,在我的另外一篇期望博客有进行实践。应该
期望经过长度
这种题目一般就是边还有长度,求到达终点的期望经过长度。
这个一般就两种求法,一种是边的期望经过次数,可以转换为两端点的期望经过次数,还有一种是直接霸王硬上弓。
第一种不讲了。
第二种我们考虑像期望经过次数一样,设 f ( x ) f(x) f(x)表示从起点到达 f ( x ) f(x) f(x)的期望长度。
那么 f ( y ) = ∑ ( x , y ) ∈ E d g e , x ≠ e d ( f ( x ) + w ( x , y ) ) p ( x , y ) = ∑ ( x , y ) ∈ E d g e , x ≠ e d f ( x ) p ( x , y ) + w ( x , y ) p ( x , y ) f(y)=\sum\limits_{(x,y)∈Edge,x≠ed}(f(x)+w(x,y))p(x,y)=\sum\limits_{(x,y)∈Edge,x≠ed}f(x)p(x,y)+w(x,y)p(x,y) f(y)=(x,y)∈Edge,x=ed∑(f(x)+w(x,y))p(x,y)=(x,y)∈Edge,x=ed∑f(x)p(x,y)+w(x,y)p(x,y)( w w w为边权)。
但是从期望的角度来看,这是错的。
这里假设边权都是 1 1 1,也就是 f ( y ) = ∑ ( x , y ) ∈ E d g e , x ≠ e d f ( x ) p ( x , y ) + p ( x , y ) f(y)=\sum\limits_{(x,y)∈Edge,x≠ed}f(x)p(x,y)+p(x,y) f(y)=(x,y)∈Edge,x=ed∑f(x)p(x,y)+p(x,y)。
存在 s t − > x st->x st−>x的路径 T T T,以及其概率 S S S,还有其价值 V V V。
那么理论上: T + y T+y T+y的 S ′ , V ′ S',V' S′,V′为 S ∗ p ( x , y ) S*p(x,y) S∗p(x,y)和 V + 1 V+1 V+1。
根据期望化一下式子: S ∗ p ( x , y ) ∗ ( V + 1 ) = S ∗ p ( x , y ) ∗ V + S ∗ p ( x , y ) S*p(x,y)*(V+1)=S*p(x,y)*V+S*p(x,y) S∗p(x,y)∗(V+1)=S∗p(x,y)∗V+S∗p(x,y),而我们发现, f ( x ) ∗ p ( x , y ) f(x)*p(x,y) f(x)∗p(x,y)其实就是 S ∗ p ( x , y ) ∗ V S*p(x,y)*V S∗p(x,y)∗V。
但是 S ∗ p ( x , y ) S*p(x,y) S∗p(x,y)嘛,根据乘法分配律: p ( x , y ) ∑ 所 有 s t − > x 的 路 径 S 每 条 路 径 的 概 率 p(x,y)\sum\limits_{所有st->x的路径} S_{每条路径的概率} p(x,y)所有st−>x的路径∑S每条路径的概率,然后我们发现,这后面不就是 E ( x ) E(x) E(x)吗,但是呢,我们的统计方法是 p ( x , y ) p(x,y) p(x,y),其实换成 E ( x ) E(x) E(x)应该(没有实践过)就是对的,但是 p ( x , y ) p(x,y) p(x,y)绝对错。(事实上,你可以发现,如果边权全部为 0 0 0,初始 V V V为 1 1 1,这其实就是求期望经过次数)
因此,期望的东西不能光凭感觉行事实际上屑作者也没有实践过,如果你不是搞期望的老司机,最好不要在没有根据的情况乱搞式子。
但是,如果我们设 f ( x ) f(x) f(x)为到达 e d ed ed的期望长度,以 f ( s t ) f(st) f(st)为答案的话,那么,式子就变成了: f ( x ) = ∑ ( x , y ) ∈ E d g e ( f ( y ) + w ( x , y ) ) p ( x , y ) = ∑ ( x , y ) ∈ E d g e f ( y ) p ( x , y ) + w ( x , y ) p ( x , y ) f(x)=\sum\limits_{(x,y)∈Edge}(f(y)+w(x,y))p(x,y)=\sum\limits_{(x,y)∈Edge}f(y)p(x,y)+w(x,y)p(x,y) f(x)=(x,y)∈Edge∑(f(y)+w(x,y))p(x,y)=(x,y)∈Edge∑f(y)p(x,y)+w(x,y)p(x,y),其中 f ( e d ) = 0 f(ed)=0 f(ed)=0。
那么这个是不是对的呢?
存在 y − > e d y->ed y−>ed的路径 T T T,以及其概率 S S S,还有其价值 V V V。
那么理论上: x + T x+T x+T的 S ′ , V ′ S',V' S′,V′为 S ∗ p ( x , y ) S*p(x,y) S∗p(x,y)和 V + w ( x , y ) V+w(x,y) V+w(x,y)。
根据期望化一下式子:
S
∗
p
(
x
,
y
)
∗
(
V
+
w
(
x
,
y
)
)
=
S
∗
p
(
x
,
y
)
∗
V
+
S
∗
p
(
x
,
y
)
∗
w
(
x
,
y
)
S*p(x,y)*(V+w(x,y))=S*p(x,y)*V+S*p(x,y)*w(x,y)
S∗p(x,y)∗(V+w(x,y))=S∗p(x,y)∗V+S∗p(x,y)∗w(x,y),而我们发现,
f
(
x
)
∗
p
(
x
,
y
)
f(x)*p(x,y)
f(x)∗p(x,y)其实还是
S
∗
V
∗
p
(
x
,
y
)
S*V*p(x,y)
S∗V∗p(x,y),但是
S
∗
p
(
x
,
y
)
∗
w
(
x
,
y
)
S*p(x,y)*w(x,y)
S∗p(x,y)∗w(x,y),把所有路径的
S
S
S加起来,它等于多少呢?不难发现,这个总和其实就是从
y
y
y到达
e
d
ed
ed的概率,显然根据洛必达法则其实就是显然,因为到
e
d
ed
ed才停,所以最后一定会到达
e
d
ed
ed,所以概率为
1
1
1,所以最终和为
p
(
x
,
y
)
∗
w
(
x
,
y
)
p(x,y)*w(x,y)
p(x,y)∗w(x,y),WOC,真的对了。
从此不难看出,因为从
e
d
ed
ed往
s
t
st
st推起的期望有一个很重要的性质,就是每个点到
e
d
ed
ed的概率都为
1
1
1,所以在做期望的时候,如果到
e
d
ed
ed就停,可以优先考虑从
e
d
ed
ed推起,思维难度可能会比较小应该吧。
其他的无向图期望自己推吧,这里只是讲讲期望概率的误区,以及一种比较直观的理解方法。
[SDOI2017]硬币游戏
题目
做法
事实上,这个只是帮助理解概率的应用问题的。
TLE做法
如果你对无向图期望认识比较浅,建议去多受点题目的折磨,简称刷题
这道题目求概率,尝试从期望经过次数入手。
首先,建立 A C AC AC机。
对于 x x x节点的两个儿子(这里 A C AC AC机用了儿子优化,即如果一个点没有这个儿子,会自动填入 f a i l fail fail的儿子到这个儿子位置)建立期望转移方程(其实就是单源多汇求期望经过次数),由于用了优化的 A C AC AC机(这里必须要用了优化的 A C AC AC机,因为每个点必须要有两个儿子。),所以是有向有环图(可能无环),处理起来其实跟无向图没什么区别,处理方法就不赘述了,因此节点个数为 n m nm nm,时间复杂度: O ( ( n m ) 3 ) O((nm)^3) O((nm)3),只能过 4 4 4个点。
但是这里其实有个优化,理论能过
70
70
70分,就是因为每个点只会出现在两条方程,不难发现,在消掉第
i
i
i项时,第
i
i
i个方程到第
n
n
n个方程中每个点也最多只会出现在两条方程中,于是可以优化到
O
(
(
n
m
)
2
)
O((nm)^2)
O((nm)2),可以过
7
7
7个点吧,应该。
证明:根据数学归纳法,假设第
j
j
j个方程到第
n
n
n个方程之间每个点最多只出现了两次(也就是只有两条方程中这个点的系数不为
0
0
0),那么在消掉第
j
j
j项时,因为每个点最多只出现两次,所以第
j
j
j个方程只与第
i
i
i个方程进行消元,蓝框框就表示点系数的转移,不难发现,第
j
+
1
j+1
j+1个方程到第
n
n
n个方程,蓝框框依旧最多两个,由于一开始就满足假设,归纳法证毕。
优化
其实不能叫优化,已经是全新做法了。
甚至和 A C AC AC机也没啥关系。
因为发现,在 A C AC AC机中,除了 e d ed ed以外,其余的点我们根本就不需要他们的期望经过次数,考虑合多为 1 1 1,化成 n + 1 n+1 n+1条方程。
现在约定: A + B A+B A+B,就是把 B B B串放到 A A A串后面形成的串,模式串就是那群人猜的串, f ( X ) f(X) f(X)表示出现 X X X模式串的概率,实际也就是包含 X X X的串的期望经过次数。
现在用 0 / 1 0/1 0/1串代替 T H TH TH,显然,一个长度为 n n n且不含任何模式串的串出现概率为 1 2 n \frac{1}{2^n} 2n1,实际上也就是期望出现次数(因为,在串后面加 0 / 1 0/1 0/1的期望经过次数转移可以写成二叉树来转移,一个点的期望经过次数为其父亲的 1 2 \frac{1}{2} 21,第 n n n层表示长度为 n n n的串,而一个点的期望等于其左右儿子的期望之和)。
有人说,但是不是有 e d ed ed吗,但是你考虑一下,如果到了 e d ed ed继续跑,那么概率是不是 1 2 n \frac{1}{2^n} 2n1,只不过到了 e d ed ed继续跑的串我们不去问他的概率,而且对于一个串 N + A N+A N+A( N + A N+A N+A的串只在最后含 A A A,且 N N N不含任何模式串, A A A为模式串),设后面的串为 T T T, N + A + T N+A+T N+A+T的长度为 n n n,我们把 N + A + T N+A+T N+A+T的概率全部加起来,很明显就是等于 N + A N+A N+A的概率,所以这样变形,概率也并不会变,只是帮助证明罢了。
现在设不含任何模式串的串的集合为 S S S(空串当然也包含在内),当然,下文为了方便,直接用 S S S表示 S S S的元素, f ( S ) f(S) f(S)表示 S S S集合中所有元素的期望出现次数, ∣ S ∣ |S| ∣S∣为 S S S元素的长度。
考虑寻找 S S S和每个模式串的关系。
对于任意一个包含 A A A的串,实际就是用 S + A S+A S+A拼接而成的,而且所有的包含 A A A的串都可以这样表示。
但是是不是意味着 f ( X ) = 1 2 m f ( S ) f(X)=\frac{1}{2^m}f(S) f(X)=2m1f(S),错!!!
比如 A = 01 , B = 00 A=01,B=00 A=01,B=00。
S + A = S + 01 S+A=S+01 S+A=S+01
但是如果 S = S ′ + 0 S=S'+0 S=S′+0,那么 S + A = S ′ + 001 = S ′ + B + 1 S+A=S'+001=S'+B+1 S+A=S′+001=S′+B+1,这样 B B B不就出现过了吗,所以 f ( B ) f(B) f(B)也就有可能惨一脚,所以就变成了 f ( X ) + ? ? ? = 1 2 m f ( S ) f(X)+???=\frac{1}{2^m}f(S) f(X)+???=2m1f(S)。
但是这惨一JO的程度有多大呢?
这里证明,如果 A A A长度为 a a a的前缀等于 B B B长度为 a a a的后缀,那么 f ( B ) f(B) f(B)惨一脚的程度为 f ( B ) ∗ 1 2 m − a f(B)*\frac{1}{2^{m-a}} f(B)∗2m−a1。
设 S = S ′ + B 长 度 为 a 的 前 缀 S=S'+B长度为a的前缀 S=S′+B长度为a的前缀, T T T为 A A A长度为 a a a的后缀。
为什么 S ′ + B + T S'+B+T S′+B+T中 B B B惨一脚的程度为 f ( B ) ∗ 1 2 m − a f(B)*\frac{1}{2^{m-a}} f(B)∗2m−a1。
实际上,你有没有考虑过 S ′ + B S'+B S′+B最先出现的也不是 B B B,但是鉴于 S S S中不含任何模式串,所以, S ′ + B S'+B S′+B中先出了 C C C串,而 B B B的前缀等于 C C C的后缀,那么 C C C的最后一个字符一定出现在 S + A S+A S+A的 A A A串区间中,所以 C C C的后缀也等于 B B B的前缀,在统计 C C C时会被统计到。
所以, f ( B ) ∗ 1 2 m − a f(B)*\frac{1}{2^{m-a}} f(B)∗2m−a1实际上加上的时 S ′ + B S'+B S′+B中 B B B时唯一模式串的情况,也就是 f ( B ) f(B) f(B),但是为什么要乘 1 2 m − a \frac{1}{2^{m-a}} 2m−a1,废话,一个长度为 ∣ S ∣ + m |S|+m ∣S∣+m,一个长度为 ∣ S ′ ∣ + m |S'|+m ∣S′∣+m,具有可比性吗,我们的目的是为了把掺一脚的程度加上,使其不再 f ( A ) f(A) f(A)中统计,而不是单纯的把 f ( B ) f(B) f(B)加上,自然需要乘 1 2 m − a \frac{1}{2^{m-a}} 2m−a1,串的表现就是 S ′ + B + T S'+B+T S′+B+T才等于 S + A S+A S+A,树的表现就是要让 S ′ + B S'+B S′+B所在点的位置等于 S + A S+A S+A的位置(乘 1 2 m − a \frac{1}{2^{m-a}} 2m−a1让层数相同, ( S + A ) (S+A) (S+A)一定在 ( S ′ + B ) (S'+B) (S′+B)的子树内)。
当然,一个字符串是可以多掺几脚的,谁说 A A A前缀等于 B B B后缀的 a a a只能有一个。
公式则为: f ( A ) + ∑ B 是 模 式 串 ∑ a = 1 m [ A 长 度 为 f(A)+\sum\limits_{B是模式串}\sum\limits_{a=1}^m[A长度为 f(A)+B是模式串∑a=1∑m[A长度为a 的 前 缀 等 于 的前缀等于 的前缀等于B 长 度 为 长度为 长度为a 的 后 缀 ] f ( B ) ∗ 1 2 m − a = f ( S ) ∗ 1 2 m 的后缀]f(B)*\frac{1}{2^{m-a}}=f(S)*\frac{1}{2^m} 的后缀]f(B)∗2m−a1=f(S)∗2m1(其中 [ x ] [x] [x]为 x x x成立, [ x ] = 1 [x]=1 [x]=1,不成立, [ x ] = 0 [x]=0 [x]=0)
当然,这里只有 n n n条公式,我们发现所有的模式串的概率加起来为 1 1 1,所以就是 ∑ A 是 模 式 串 f ( A ) = 1 \sum\limits_{A是模式串}f(A)=1 A是模式串∑f(A)=1。
这样就有 n + 1 n+1 n+1条方程了。
匹配前缀后缀后Hash。
时间复杂度: O ( n 3 ) O(n^3) O(n3)。
#include<cstdio>
#include<cstring>
#include<algorithm>
#define N 310
using namespace std;
typedef long long LL;
template<class T>
inline T zabs(T x){return x>=0?x:-x;}
char st[N][N];
LL has[N][N],ta=235,tb=1e9+7,fc[N];
inline LL find_hash(LL *ha,int l,int r){return (ha[r]-(ha[l-1]*fc[r-l+1])%tb+tb)%tb;}
int n,m;
long double erfen[N];
long double f[N][N],ans[N];
void GSXY()
{
n++;
for(int i=1;i<=n;i++)
{
int id=i;
for(int j=i+1;j<=n;j++)
{
if(zabs(f[j][i])>zabs(f[id][i]))id=j;
}
if(id!=i)swap(f[id],f[i]);
for(int j=i+1;j<=n;j++)
{
double bili=f[j][i]/f[i][i];
for(int k=n+1;k>=i;k--)f[j][k]-=f[i][k]*bili;
}
}
for(int i=n;i>=1;i--)
{
ans[i]=f[i][n+1]/f[i][i];
for(int j=i-1;j>=1;j--)f[j][n+1]-=ans[i]*f[j][i];
}
n--;
}
int main()
{
scanf("%d%d",&n,&m);
fc[0]=1;for(int i=1;i<=m;i++)fc[i]=fc[i-1]*ta%tb;
erfen[0]=1;for(int i=1;i<=m;i++)erfen[i]=erfen[i-1]*0.5;
for(int i=1;i<=n;i++)scanf("%s",st[i]+1);
for(int i=1;i<=n;i++)
{
for(int j=1;j<=m;j++)has[i][j]=(has[i][j-1]*ta+st[i][j]-'A'+1)%tb/*这里如果不加1,可能会使代码很难辨析AAB和AB*/;
}
for(int i=1;i<=n;i++)
{
f[i][n+1]=-erfen[m];
for(int j=1;j<=n;j++)
{
for(int k=1;k<=m;k++)
{
if(find_hash(has[j],m-k+1,m)==find_hash(has[i],1,k))f[i][j]+=erfen[m-k];
}
}
}
f[n+1][n+2]=1;for(int i=1;i<=n;i++)f[n+1][i]=1;
GSXY();
for(int i=1;i<=n;i++)printf("%Lf\n",ans[i]);
return 0;
}
小结
概率期望真美妙。