【期望DP】概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

大概想了两三天的期望DP,这么笨大概是因为高中没有好好学习,整理了下,方便以后复习。

让我们从一个题入手(绿豆蛙的归宿
题目描述

给出张 n n n 个点 m m m 条边的有向无环图,起点为 1 1 1,终点为 n n n,每条边都有一个长度,并且从起点出发能够到达所有的点,所有的点也都能够到达终点。绿豆蛙从起点出发,走向终点。 到达每一个顶点时,如果该节点有 k k k 条出边,绿豆蛙可以选择任意一条边离开该点,并且走向每条边的概率为 1 k \frac{1}{k} k1 现在绿豆蛙想知道,从起点走到终点的所经过的路径总长度期望是多少?

直观的想,我们只要找出所有能到达 n n n号点的通路,加上其概率乘以权值,就是最终答案。
E ( x ) = p 1 x 1 + p 2 x 2 + . . . . + p n x n E(x) = p_1x_1 + p_2x_2 + .... + p_nx_n E(x)=p1x1+p2x2+....+pnxn
我们如果从 i i i点走到 j j j点,权值是w
那么1到y的期望为
E ( y ) = p 1 ( x 1 + w ) + p 2 ( x 2 + w ) + . . . + p n ( x n + w ) E ( y ) = E ( x ) + ∑ p i ∗ w 可 以 推 得 E ( y ) 的 期 望 转 移 方 程 为 E ( y ) = ∑ i = 1 i n [ y ] ( E ( x ) + ∑ p i ∗ w ) o u t [ x ] E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\ E(y) = E(x) + ∑p_i * w\\ 可以推得E(y)的期望转移方程为\\ E(y) = ∑_{i = 1} ^ {in[y]}\frac{(E(x) + ∑p_i * w)}{out[x]} E(y)=p1(x1+w)+p2(x2+w)+...+pn(xn+w)E(y)=E(x)+piwE(y)E(y)=i=1in[y]out[x](E(x)+piw)
其中 1 o u t [ x ] \frac{1}{out[x]} out[x]1为从x点到y点的概率。
代码如下:

#include <bits/stdc++.h>

using namespace std;

const int N = 1e6 + 10;

int n , m;
double f[N];
double pro[N];
int a , b , c;
int in[N] , out[N] , w[N];
int h[N] , e[N] , ne[N] ,idx;

void add(int a , int b , int c)
{
    out[a] ++ , in[b] ++ , w[idx] = c;
    e[idx] = b , ne[idx] = h[a] , h[a] = idx ++;
}

void topsort()
{
    queue<int> q;
    f[1] = 0; pro[1] = 1;
    for (int i = 1;i <= n;i ++) if (!in[i]) q.push(i);
    while (q.size()) {
        int x = q.front();
        q.pop();
        
        for (int i = h[x]; ~i ;i = ne[i]) {
            int y = e[i];
            f[y] += (f[x] + pro[x] * (double)w[i]) / (double)out[x];
            pro[y] += pro[x] / (double)out[x];
            if(--in[y] == 0) q.push(y);
        }
    }
}

int main() {
    scanf("%d %d" , &n , &m);
    memset(h , -1 , sizeof h);
    for (int i = 0;i < m;i ++) {
        scanf("%d %d %d" , &a , &b  , &c);
        add(a , b , c);
    }
    topsort();
    printf("%.2lf\n" , f[n]);
    return 0;
}

这是正推的方法,下面我们来思考逆推。
正推我们找的是从 1 1 1 i i i点的概率,我们称之为 p r o [ i ] pro[i] pro[i],更新方法是
p r o [ y ] + = p r o [ x ] + p r o [ x ] / o u t [ x ] pro[y] += pro[x] + pro[x] / out[x] pro[y]+=pro[x]+pro[x]/out[x]
逆推改怎么逆推呢?
我们假设 p i p_i pi为从 i i i n n n点的概率, E ( x ) E(x) E(x)为从 x x x n n n的期望。
我们重新看一下柿子:
E ( y ) = p 1 ( x 1 + w ) + p 2 ( x 2 + w ) + . . . + p n ( x n + w ) E ( y ) = E ( x ) + ∑ p i ∗ w 其 中 ∑ p i = 1 E ( y ) = E ( x ) + w E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\ E(y) = E(x) + ∑p_i * w\\ 其中∑pi = 1\\ E(y) = E(x) + w E(y)=p1(x1+w)+p2(x2+w)+...+pn(xn+w)E(y)=E(x)+piwpi=1E(y)=E(x)+w
那么,与正推不同的地方是什么呢?第一, p i p_i pi的定义不同,第二,到终点的概率和一定为 1 1 1,而正推的概率和不一定为1。我们可以考虑一个记忆化搜索,这样就完美解决了这个题。

#include <bits/stdc++.h>
using namespace std;

const int N = 1e5 + 10;
const int M = N * 2;

int n , m;
double f[N];
int h[N] , w[M] , e[M] , ne[M] , idx; 
int in[N] , out[N];

int add(int a , int b , int c) {
    e[idx] = b , w[idx] = c , ne[idx] = h[a] , h[a] = idx ++;
}

double dp(int u)
{
    if (f[u] >= 0) return f[u];
    
    f[u] = 0;
    
    for (int i = h[u]; ~i ;i = ne[i]) {
        int j = e[i];
        f[u] += (dp(j) + w[i]) / out[u];
    }
    
    return f[u];
}

int main()
{
    memset(h , -1 , sizeof h);
    scanf("%d %d",&n , &m);
    for (int i = 1;i <= m;i ++) {
        int a , b , c;
        scanf("%d %d %d" , &a , &b , &c);
        add(a , b , c);
        out[a] ++;
    }
    memset(f , -1 , sizeof f);
    printf("%.2lf\n" , dp(1));
    return 0;    
}
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值