[BZOJ4720][NOIP2016]换教室-期望DP

说在前面

其实只要之前写过一些简单期望,想这道题都不是很难。状态很容易就想到了。

然而me被Floyd坑了,一开始赋值无限大的时候,忘记了把每个dis[i][i]赋值为0(如果不赋值为0,那么dis[i][i]就会被更新为最小的dis[i][k] + dis[k][i]),最后样例跑出来就是7.2。


题目

BZOJ4720传送门
有v个教室和e条路径。有n个时刻,每个时刻相同的课程会在两个教室同时进行。一开始,i时刻都会被安排在c[i]教室上课,可以申请换去课室d[i]上课,只能申请一次且成功率为p[i],最多申请m次,若时刻i在教室x上完课且下一时刻要到教室y上课,则需要dis[x,y]的时间。问如何分配申请使得期望耗费的时间最小。申请必须一次性给出,也就是说不能根据上节课申请的结果来判断这节课是否申请。
v<=300,n,m<=2000

输入输出就不给了,都差不多的= =


题解

很容易想到dp[i][j][0/1]来表示
[已经上了第i节课(当前是第i节),已经申请了j次换课,当前是否申请换课]的期望

注意第三维[0/1]表示的是是否申请,而不是申请成功与否,如果用后者,讨论起来将会十分麻烦。

转移比较麻烦,需要分情况讨论:
—–>对于当前这次不申请的情况:分类讨论上一次是否申请(以及如果成功了,是否申请成功会对应相应的权值)
—–>对于当前这次要申请的情况:分类讨论上一次是否申请(如果这次成功,或者上一次成功,都对应着不同的权值)
DP方程看着比长,其实很简单。
细节看代码吧=w=


下面是自带大常数的代码

强迫症的我把dp方程写的十分整齐(然而看着很奇怪)

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std ;

int N , M , V , E , c[2005] , d[2005] ;
double G[2005] , dp[2005][2005][2] , dis[305][305] , ans = 1e30 ;

void Floyd(){
    for( int k = 1 ; k <= V ; k ++ )
        for( int i = 1 ; i <= V ; i ++ )
            for( int j = 1 ; j <= V ; j ++ )
                if( dis[i][j] > dis[i][k] + dis[k][j] )
                    dis[i][j] = dis[i][k] + dis[k][j] ;
}

void solve(){
    Floyd() ;
    for( int i = 1 ; i <= N ; i ++ )
        for( int j = 0 ; j <= M ; j ++ )
            dp[i][j][0] = dp[i][j][1] = 1e30 ;
    dp[0][0][0] = 0 ;
    dp[1][0][0] = 0 ;
    dp[1][1][1] = 0 ;
    for( int i = 2 ; i <= N ; i ++ ){
        for( int j = 0 ; j <= M && j <= i ; j ++ ){
            dp[i][j][0] = min( dp[i-1][j][0] + dis[ c[i-1] ][ c[i] ] ,

                               dp[i-1][j][1] + dis[ c[i-1] ][ c[i] ] * ( 1.0 - G[i-1] ) +
                                               dis[ d[i-1] ][ c[i] ] * G[i-1] ) ;

            if( j >= 1 ) 
            dp[i][j][1] = min( dp[i-1][j-1][0] + dis[ c[i-1] ][ c[i] ] * ( 1.0 - G[i] ) +
                                                 dis[ c[i-1] ][ d[i] ] * G[i] ,

                               dp[i-1][j-1][1] + dis[ c[i-1] ][ c[i] ] * ( 1.0 - G[i] ) * ( 1.0 - G[i-1] ) +
                                                 dis[ c[i-1] ][ d[i] ] * G[i] * ( 1.0 - G[i-1] ) +
                                                 dis[ d[i-1] ][ c[i] ] * ( 1.0 - G[i] ) * G[i-1] +
                                                 dis[ d[i-1] ][ d[i] ] * G[i] * G[i-1] ) ;
        }
    }
    for( int i = 0 ; i <= M ; i ++ )
        ans = min( ans , dp[N][i][0] ) ;
    for( int i = 0 ; i <= M ; i ++ )
        ans = min( ans , dp[N][i][1] ) ;
    printf( "%.2f" , ans ) ;
}

int main(){
    scanf( "%d%d%d%d" , &N , &M , &V , &E ) ;
    for( int i = 1 ; i <= N ; i ++ ) scanf( "%d" , &c[i] ) ;
    for( int i = 1 ; i <= N ; i ++ ) scanf( "%d" , &d[i] ) ;
    for( int i = 1 ; i <= N ; i ++ ) scanf( "%lf" , &G[i] ) ;
    for( int i = 1 ; i <= V ; i ++ )
        for( int j = 1 ; j <= V ; j ++ ){
            if (i==j) dis[i][j]=0;
            else dis[i][j] = 123456790.0;
        }

    for( int i = 1 ; i <= E ; i ++ ){
        int u , v ; double x ;
        scanf( "%d%d%lf" , &u , &v , &x ) ;
        dis[u][v] = dis[v][u] = min( dis[u][v] , x ) ;
    }
    solve() ;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值