[BZOJ4720][NOIP2016]换教室-期望DP

最新推荐文章于 2018-05-16 10:19:34 发布

泉華子

最新推荐文章于 2018-05-16 10:19:34 发布

阅读量311

点赞数

分类专栏：期望DP and 概率DP ------dp------ 文章标签： dp

本文链接：https://blog.csdn.net/Izumi_Hanako/article/details/78221676

版权

------dp------ 同时被 2 个专栏收录

34 篇文章 0 订阅

订阅专栏

期望DP and 概率DP

13 篇文章 0 订阅

订阅专栏

说在前面

其实只要之前写过一些简单期望，想这道题都不是很难。状态很容易就想到了。

然而me被Floyd坑了，一开始赋值无限大的时候，忘记了把每个dis[i][i]赋值为0（如果不赋值为0,那么dis[i][i]就会被更新为最小的dis[i][k] + dis[k][i]），最后样例跑出来就是7.2。

题目

BZOJ4720传送门
有v个教室和e条路径。有n个时刻，每个时刻相同的课程会在两个教室同时进行。一开始，i时刻都会被安排在c[i]教室上课，可以申请换去课室d[i]上课，只能申请一次且成功率为p[i]，最多申请m次，若时刻i在教室x上完课且下一时刻要到教室y上课，则需要dis[x,y]的时间。问如何分配申请使得期望耗费的时间最小。申请必须一次性给出，也就是说不能根据上节课申请的结果来判断这节课是否申请。
v<=300,n,m<=2000

输入输出就不给了，都差不多的= =

题解

很容易想到dp[i][j][0/1]来表示
[已经上了第i节课（当前是第i节）,已经申请了j次换课,当前是否申请换课]的期望

注意第三维[0/1]表示的是是否申请，而不是申请成功与否，如果用后者，讨论起来将会十分麻烦。

转移比较麻烦，需要分情况讨论：
—–>对于当前这次不申请的情况：分类讨论上一次是否申请（以及如果成功了，是否申请成功会对应相应的权值）
—–>对于当前这次要申请的情况：分类讨论上一次是否申请（如果这次成功，或者上一次成功，都对应着不同的权值）
DP方程看着比长，其实很简单。
细节看代码吧=w=

下面是自带大常数的代码

强迫症的我把dp方程写的十分整齐（然而看着很奇怪）

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std ;

int N , M , V , E , c[2005] , d[2005] ;
double G[2005] , dp[2005][2005][2] , dis[305][305] , ans = 1e30 ;

void Floyd(){
    for( int k = 1 ; k <= V ; k ++ )
        for( int i = 1 ; i <= V ; i ++ )
            for( int j = 1 ; j <= V ; j ++ )
                if( dis[i][j] > dis[i][k] + dis[k][j] )
                    dis[i][j] = dis[i][k] + dis[k][j] ;
}

void solve(){
    Floyd() ;
    for( int i = 1 ; i <= N ; i ++ )
        for( int j = 0 ; j <= M ; j ++ )
            dp[i][j][0] = dp[i][j][1] = 1e30 ;
    dp[0][0][0] = 0 ;
    dp[1][0][0] = 0 ;
    dp[1][1][1] = 0 ;
    for( int i = 2 ; i <= N ; i ++ ){
        for( int j = 0 ; j <= M && j <= i ; j ++ ){
            dp[i][j][0] = min( dp[i-1][j][0] + dis[ c[i-1] ][ c[i] ] ,

                               dp[i-1][j][1] + dis[ c[i-1] ][ c[i] ] * ( 1.0 - G[i-1] ) +
                                               dis[ d[i-1] ][ c[i] ] * G[i-1] ) ;

            if( j >= 1 ) 
            dp[i][j][1] = min( dp[i-1][j-1][0] + dis[ c[i-1] ][ c[i] ] * ( 1.0 - G[i] ) +
                                                 dis[ c[i-1] ][ d[i] ] * G[i] ,

                               dp[i-1][j-1][1] + dis[ c[i-1] ][ c[i] ] * ( 1.0 - G[i] ) * ( 1.0 - G[i-1] ) +
                                                 dis[ c[i-1] ][ d[i] ] * G[i] * ( 1.0 - G[i-1] ) +
                                                 dis[ d[i-1] ][ c[i] ] * ( 1.0 - G[i] ) * G[i-1] +
                                                 dis[ d[i-1] ][ d[i] ] * G[i] * G[i-1] ) ;
        }
    }
    for( int i = 0 ; i <= M ; i ++ )
        ans = min( ans , dp[N][i][0] ) ;
    for( int i = 0 ; i <= M ; i ++ )
        ans = min( ans , dp[N][i][1] ) ;
    printf( "%.2f" , ans ) ;
}

int main(){
    scanf( "%d%d%d%d" , &N , &M , &V , &E ) ;
    for( int i = 1 ; i <= N ; i ++ ) scanf( "%d" , &c[i] ) ;
    for( int i = 1 ; i <= N ; i ++ ) scanf( "%d" , &d[i] ) ;
    for( int i = 1 ; i <= N ; i ++ ) scanf( "%lf" , &G[i] ) ;
    for( int i = 1 ; i <= V ; i ++ )
        for( int j = 1 ; j <= V ; j ++ ){
            if (i==j) dis[i][j]=0;
            else dis[i][j] = 123456790.0;
        }

    for( int i = 1 ; i <= E ; i ++ ){
        int u , v ; double x ;
        scanf( "%d%d%lf" , &u , &v , &x ) ;
        dis[u][v] = dis[v][u] = min( dis[u][v] , x ) ;
    }
    solve() ;
}