[BZOJ1076]奖励关-状压+期望

最新推荐文章于 2018-11-03 08:07:31 发布

泉華子

最新推荐文章于 2018-11-03 08:07:31 发布

阅读量321

点赞数

分类专栏：期望DP and 概率DP 文章标签： dp

本文链接：https://blog.csdn.net/Izumi_Hanako/article/details/78273632

版权

期望DP and 概率DP 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

说在前面

挺简单的一道题。一开始看别人题解里的dp状态定义看的一脸mengbi…
理解状态之后就是基础期望了

题目

BZOJ1076

题意

（由于原题目描述十分不清真，我还是自己写题意好啦）
现在有N个物品，K个回合。每个物品都有一个属性：权值v。
每个回合，这N个物品都会等概率的被抛出。你可以选择是否拾取它，并且你的选取尽量达到最优策略。有些物品不是你想拾取就能拾取的，除非你在拾取它之前已经拥有某些物品。每个回合结束时，未被拾取的物品会被清空。

输入&&输出

第一行输入两个整数K,N
接下来N行，每行若干个数字。第一个数字表示该物品的权值，接下来一些数字表示选取这个物品之前需要选取的物品，以0结尾。

解法

定义dp[i][state]表示从第i回合开始，当前状态为state时，进行到所有回合结束后的期望得分。（也可以理解为还剩下K-i个回合，初始状态为state时（此时得分还是0），进行完所有回合的期望得分）

很明显有这样的DP方程：（设lim[k]表示k物品的限制）

for( each k ){
if( (state&lim[k] ) == lim[k] )
    dp[i][state] += max( dp[i][state] , dp[i+1][ state|( 1<<( k-1 )+score[k] )/N
    /*可选的话，选较优的决策转移*/
else
    dp[i][state] += dp[i+1][state]/N
}

关于为什么要这样定义，如果正推的话，期望就变成了：从开局到state的概率乘以权值。这样的话计算就要同时算概率和权值

自带大常数的代码

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std ;

int K , N , lim[20] , score[20] ;
double dp[105][1<<15] ;

int main(){
    scanf( "%d%d" , &K , &N ) ;
    for( int i = 1 , tmp ; i <= N ; i ++ ){
        scanf( "%d" , &score[i] ) ;
        scanf( "%d" , &tmp ) ;
        while( tmp ){
            lim[i] |= ( 1 << ( tmp - 1 ) ) ;
            scanf( "%d" , &tmp ) ;
        }
    }
    for( int i = K ; i ; i -- ){
        for( int j = 0 ; j < ( 1 << N ) ; j ++ ){
            for( int k = 1 ; k <= N ; k ++ ){
                if( ( j & lim[k] ) == lim[k] )
                    dp[i][j] += max( dp[i+1][j] , dp[i+1][ j|( 1 << ( k - 1 ) ) ] + score[k] ) ;
                else 
                    dp[i][j] += dp[i+1][j] ;
            }
            dp[i][j] /= N ;
        }
    }
    printf( "%.6f" , dp[1][0] ) ;
}

泉華子

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[BZOJ1076]奖励关-状压+期望

说在前面挺简单的一道题。一开始看别人题解里的dp状态定义看的一脸mengbi… 理解状态之后就是基础期望了题目BZOJ1076题意（由于原题目描述十分不清真，我还是自己写题意好啦）现在有N个物品，K个回合。每个物品都有一个属性：权值v。每个回合，这N个物品都会等概率的被抛出。你可以选择是否拾取它，并且你的选取尽量达到最优策略。有些物品不是你想拾取就能拾取的...
复制链接

扫一扫