洛谷P1850 换教室_数学期望_Floyd

调了一下午QAQ…让我对数学期望的理解又提升了一个层次。
首先,我们发现 v<=300 , 这样我们就可以用 Floyd 算法来 O(n3) 处理出任意两点间的最短路。
对于题目,我们不难列出状态dp[i][j][0/1]
这个状态代表:走到第i个点,用了j次机会,当前使用了(0表示未使用,1表示使用)机会的最小期望值。
首先,我们考虑dp[i][j][0],那么上一个点可能使用了机会,也可能未使用机会。
不难列出未使用机会的方程:

dp[i][j][0]=dp[i1][j][0]+f[ci1][ci]

那么对于上一次使用了机会,方程应为:

dp[i][j][0]=dp[i1][j][1]+f[ci1][ci](1k[i1])+f[di1][ci]k[i1]

体会一下,上一次使用机会的话会面临两种情况:
1.交换成功,路程为f[di1][ci],概率为k[i1].
2.未交换成功,路程为f[ci1][ci],概率为1k[i1].

再考虑一下当前使用机会,分6种情况。
1.上一轮未交换,当前交换失败:路程为f[ci1][ci],概率为1k[i]
2.上一轮未交换,当前交换成功:路程为f[ci1][di],概率为k[i]
3.上一轮交换失败,当前交换失败,路程为f[ci1][ci],概率为(1k[i1])(1k[i])
4.上一轮交换失败,当前交换成功,路程为f[ci1][di],概率为(1k[i1])k[i]
5.上一轮交换成功,当前交换失败,路程为f[di1][ci],概率为k[i1](1k[i])
6.上一轮交换成功,当前交换成功,路程为f[di1][di],概率为k[i1]k[i]
最后将所有信息合并即可,另外细节巨多,到注意初始化。
Code:

#include<cstdio>
#include<algorithm>
#include<cstring>
using namespace std;
const int maxn = 350;
const int N = 2000 + 5;
const double inf = 1000000000;
int f[maxn][maxn], c[N], d[N], n,m,v,e;
double k[N], dp[N][N][2];
inline void update(double &a, double b){ if(b < a) a = b;}
int main()
{
    scanf("%d%d%d%d",&n,&m,&v,&e);
    for(int i = 1;i <= n; ++i) scanf("%d",&c[i]);
    for(int i = 1;i <= n; ++i) scanf("%d",&d[i]);
    for(int i = 1;i <= n; ++i) scanf("%lf",&k[i]);
    for(int i = 1;i <= v; ++i) for(int j = 1;j <= v; ++j) f[i][j] = f[j][i] = inf;
    for(int i = 1;i <= e; ++i)
    {
        int a,b,c;
        scanf("%d%d%d",&a,&b,&c);
        f[a][b] = f[b][a] = min(f[a][b], c);
    }
    for(int i = 0;i <= v; ++i) f[i][0] = f[0][i] = f[i][i] = 0;
    for(int k = 1;k <= v; ++k)
        for(int i = 1;i <= v; ++i)
            for(int j = 1;j <= v; ++j) 
                if(f[i][k] != inf && f[k][j] != inf)f[i][j] = min(f[i][j], f[i][k] + f[k][j]);  
    for (int i = 0; i <= n; ++i)
        for (int j = 0; j <= m; ++j)dp[i][j][0] = dp[i][j][1] = inf;
     dp[1][0][0] = dp[1][1][1] = dp[0][0][0] = 0;
    for(int i = 1;i <= n; ++i)
    {
        dp[i][0][0] = dp[i-1][0][0] + f[c[i-1]][c[i]];
        for(int j = 1;j <= min(i,m); ++j)
        {
            update(dp[i][j][0], dp[i-1][j][0] + f[c[i-1]][c[i]]);
            update(dp[i][j][0], dp[i-1][j][1] + f[c[i-1]][c[i]] * (1 - k[i-1]) + f[d[i-1]][c[i]] * k[i-1]);
            if(j >= 1)
            {
                double tmp = 0.0;
                update(dp[i][j][1], dp[i-1][j-1][0] + f[c[i-1]][d[i]] * k[i] + f[c[i-1]][c[i]] * (1 - k[i]));
                tmp = dp[i-1][j-1][1];
                tmp += f[c[i-1]][c[i]] * (1 - k[i-1]) * (1 - k[i]);           
                tmp += f[d[i-1]][c[i]] * k[i-1] * (1 - k[i]);                
                tmp += f[c[i-1]][d[i]] * (1 - k[i-1]) * k[i];                  
                tmp += f[d[i-1]][d[i]] * k[i-1] * k[i];                 
                update(dp[i][j][1], tmp);
            }
        }
    }
    double ans = inf;
    for(int j = 0;j <= m; ++j)
    {
        update(ans, dp[n][j][0]);
        update(ans, dp[n][j][1]);
    }
    printf("%.2f",ans);
    return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值