洛谷P1850 换教室_数学期望_Floyd

最新推荐文章于 2020-03-14 10:36:32 发布

EM-LGH

最新推荐文章于 2020-03-14 10:36:32 发布

阅读量125

点赞数

本文链接：https://blog.csdn.net/liyong1009s/article/details/82830141

版权

调了一下午QAQ…让我对数学期望的理解又提升了一个层次。
首先，我们发现 $v < = 300$ , 这样我们就可以用 $F l o y d$ 算法来 $O(n^3)$ 处理出任意两点间的最短路。
对于题目，我们不难列出状态 $d p [i] [j] [0 / 1]$ 。
这个状态代表：走到第 $i$ 个点，用了 $j$ 次机会，当前使用了（0表示未使用，1表示使用）机会的最小期望值。
首先，我们考虑 $d p [i] [j] [0]$ ，那么上一个点可能使用了机会，也可能未使用机会。
不难列出未使用机会的方程：

$dp[i][j][0]=dp[i-1][j][0]+f[c_{i-1}][c_{i}]$

那么对于上一次使用了机会，方程应为：

$dp[i][j][0]=dp[i-1][j][1] + f[c_{i-1}][c_{i}] * (1 - k[i-1]) + f[ d_{i-1}][c_{i}] * k[i-1]$

体会一下，上一次使用机会的话会面临两种情况：
1.交换成功，路程为 $f[d_{i-1}][c_{i}]$ ，概率为 $k [i - 1]$ .
2.未交换成功，路程为 $f[c_{i-1}][c_{i}]$ ，概率为 $1 - k [i - 1]$ .

再考虑一下当前使用机会，分6种情况。
1.上一轮未交换，当前交换失败：路程为 $f[c_{i-1}][c_{i}]$ ，概率为 $1 - k [i]$
2.上一轮未交换，当前交换成功：路程为 $f[c_{i-1}][d_{i}]$ ，概率为 $k [i]$
3.上一轮交换失败，当前交换失败，路程为 $f[c_{i-1}][c_{i}]$ ，概率为 $(1 - k [i - 1]) * (1 - k [i])$
4.上一轮交换失败，当前交换成功，路程为 $f[c_{i-1}][d_{i}]$ ，概率为 $(1 - k [i - 1]) * k [i]$
5.上一轮交换成功，当前交换失败，路程为 $f[d_{i-1}][c_{i}]$ ，概率为 $k [i - 1] * (1 - k [i])$
6.上一轮交换成功，当前交换成功，路程为 $f[d_{i-1}][d_{i}]$ ，概率为 $k [i - 1] * k [i]$
最后将所有信息合并即可，另外细节巨多，到注意初始化。
Code：

#include<cstdio>
#include<algorithm>
#include<cstring>
using namespace std;
const int maxn = 350;
const int N = 2000 + 5;
const double inf = 1000000000;
int f[maxn][maxn], c[N], d[N], n,m,v,e;
double k[N], dp[N][N][2];
inline void update(double &a, double b){ if(b < a) a = b;}
int main()
{
    scanf("%d%d%d%d",&n,&m,&v,&e);
    for(int i = 1;i <= n; ++i) scanf("%d",&c[i]);
    for(int i = 1;i <= n; ++i) scanf("%d",&d[i]);
    for(int i = 1;i <= n; ++i) scanf("%lf",&k[i]);
    for(int i = 1;i <= v; ++i) for(int j = 1;j <= v; ++j) f[i][j] = f[j][i] = inf;
    for(int i = 1;i <= e; ++i)
    {
        int a,b,c;
        scanf("%d%d%d",&a,&b,&c);
        f[a][b] = f[b][a] = min(f[a][b], c);
    }
    for(int i = 0;i <= v; ++i) f[i][0] = f[0][i] = f[i][i] = 0;
    for(int k = 1;k <= v; ++k)
        for(int i = 1;i <= v; ++i)
            for(int j = 1;j <= v; ++j) 
                if(f[i][k] != inf && f[k][j] != inf)f[i][j] = min(f[i][j], f[i][k] + f[k][j]);  
    for (int i = 0; i <= n; ++i)
        for (int j = 0; j <= m; ++j)dp[i][j][0] = dp[i][j][1] = inf;
     dp[1][0][0] = dp[1][1][1] = dp[0][0][0] = 0;
    for(int i = 1;i <= n; ++i)
    {
        dp[i][0][0] = dp[i-1][0][0] + f[c[i-1]][c[i]];
        for(int j = 1;j <= min(i,m); ++j)
        {
            update(dp[i][j][0], dp[i-1][j][0] + f[c[i-1]][c[i]]);
            update(dp[i][j][0], dp[i-1][j][1] + f[c[i-1]][c[i]] * (1 - k[i-1]) + f[d[i-1]][c[i]] * k[i-1]);
            if(j >= 1)
            {
                double tmp = 0.0;
                update(dp[i][j][1], dp[i-1][j-1][0] + f[c[i-1]][d[i]] * k[i] + f[c[i-1]][c[i]] * (1 - k[i]));
                tmp = dp[i-1][j-1][1];
                tmp += f[c[i-1]][c[i]] * (1 - k[i-1]) * (1 - k[i]);           
                tmp += f[d[i-1]][c[i]] * k[i-1] * (1 - k[i]);                
                tmp += f[c[i-1]][d[i]] * (1 - k[i-1]) * k[i];                  
                tmp += f[d[i-1]][d[i]] * k[i-1] * k[i];                 
                update(dp[i][j][1], tmp);
            }
        }
    }
    double ans = inf;
    for(int j = 0;j <= m; ++j)
    {
        update(ans, dp[n][j][0]);
        update(ans, dp[n][j][1]);
    }
    printf("%.2f",ans);
    return 0;
}