【期望DP】概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

最新推荐文章于 2022-08-31 12:47:30 发布

skywalker767

最新推荐文章于 2022-08-31 12:47:30 发布

阅读量180

点赞数 3

分类专栏：数论

本文链接：https://blog.csdn.net/m0_51990674/article/details/119728756

版权

数论专栏收录该内容

10 篇文章 0 订阅

订阅专栏

大概想了两三天的期望DP，这么笨大概是因为高中没有好好学习，整理了下，方便以后复习。

让我们从一个题入手（绿豆蛙的归宿）
题目描述

给出张 $n$ 个点 $m$ 条边的有向无环图，起点为 $1$ ，终点为 $n$ ，每条边都有一个长度，并且从起点出发能够到达所有的点，所有的点也都能够到达终点。绿豆蛙从起点出发，走向终点。到达每一个顶点时，如果该节点有 $k$ 条出边，绿豆蛙可以选择任意一条边离开该点，并且走向每条边的概率为 $\frac{1}{k}$ 现在绿豆蛙想知道，从起点走到终点的所经过的路径总长度期望是多少？

直观的想，我们只要找出所有能到达 $n$ 号点的通路，加上其概率乘以权值，就是最终答案。
$E(x) = p_1x_1 + p_2x_2 + .... + p_nx_n$
我们如果从 $i$ 点走到 $j$ 点，权值是w
那么1到y的期望为
$p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\ E(y) = E(x) + ∑p_i * w\\ 可以推得E(y)的期望转移方程为\\ E(y) = ∑_{i = 1} ^ {in[y]}\frac{(E(x) + ∑p_i * w)}{out[x]}$
其中 $\frac{1}{out[x]}$ 为从x点到y点的概率。
代码如下:

#include <bits/stdc++.h>

using namespace std;

const int N = 1e6 + 10;

int n , m;
double f[N];
double pro[N];
int a , b , c;
int in[N] , out[N] , w[N];
int h[N] , e[N] , ne[N] ,idx;

void add(int a , int b , int c)
{
    out[a] ++ , in[b] ++ , w[idx] = c;
    e[idx] = b , ne[idx] = h[a] , h[a] = idx ++;
}

void topsort()
{
    queue<int> q;
    f[1] = 0; pro[1] = 1;
    for (int i = 1;i <= n;i ++) if (!in[i]) q.push(i);
    while (q.size()) {
        int x = q.front();
        q.pop();
        
        for (int i = h[x]; ~i ;i = ne[i]) {
            int y = e[i];
            f[y] += (f[x] + pro[x] * (double)w[i]) / (double)out[x];
            pro[y] += pro[x] / (double)out[x];
            if(--in[y] == 0) q.push(y);
        }
    }
}

int main() {
    scanf("%d %d" , &n , &m);
    memset(h , -1 , sizeof h);
    for (int i = 0;i < m;i ++) {
        scanf("%d %d %d" , &a , &b  , &c);
        add(a , b , c);
    }
    topsort();
    printf("%.2lf\n" , f[n]);
    return 0;
}

这是正推的方法，下面我们来思考逆推。
正推我们找的是从 $1$ 到 $i$ 点的概率，我们称之为 $p r o [i]$ ,更新方法是
$p r o [y] + = p r o [x] + p r o [x] / o u t [x]$
逆推改怎么逆推呢？
我们假设 $p_i$ 为从 $i$ 到 $n$ 点的概率， $E (x)$ 为从 $x$ 到 $n$ 的期望。
我们重新看一下柿子：
$E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\ E(y) = E(x) + ∑p_i * w\\ 其中∑pi = 1\\ E(y) = E(x) + w$
那么，与正推不同的地方是什么呢？第一， $p_i$ 的定义不同，第二，到终点的概率和一定为 $1$ ，而正推的概率和不一定为1。我们可以考虑一个记忆化搜索，这样就完美解决了这个题。

#include <bits/stdc++.h>
using namespace std;

const int N = 1e5 + 10;
const int M = N * 2;

int n , m;
double f[N];
int h[N] , w[M] , e[M] , ne[M] , idx; 
int in[N] , out[N];

int add(int a , int b , int c) {
    e[idx] = b , w[idx] = c , ne[idx] = h[a] , h[a] = idx ++;
}

double dp(int u)
{
    if (f[u] >= 0) return f[u];
    
    f[u] = 0;
    
    for (int i = h[u]; ~i ;i = ne[i]) {
        int j = e[i];
        f[u] += (dp(j) + w[i]) / out[u];
    }
    
    return f[u];
}

int main()
{
    memset(h , -1 , sizeof h);
    scanf("%d %d",&n , &m);
    for (int i = 1;i <= m;i ++) {
        int a , b , c;
        scanf("%d %d %d" , &a , &b , &c);
        add(a , b , c);
        out[a] ++;
    }
    memset(f , -1 , sizeof f);
    printf("%.2lf\n" , dp(1));
    return 0;    
}

skywalker767

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【期望DP】概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

大概想了两三天，这么笨大概是因为高中没有好好学习，整理了下，方便以后复习。让我们从一个题入手（绿豆蛙的归宿）题目描述给出张 nnn 个点 mmm 条边的有向无环图，起点为 111，终点为 nnn，每条边都有一个长度，并且从起点出发能够到达所有的点，所有的点也都能够到达终点。绿豆蛙从起点出发，走向终点。到达每一个顶点时，如果该节点有 kkk 条出边，绿豆蛙可以选择任意一条边离开该点，并且走向每条边的概率为 1k\frac{1}{k}k1 现在绿豆蛙想知道，从起点走到终点的所经过的路径总长度期望.
复制链接

扫一扫

专栏目录