BZOJ1076：奖励关（状压期望dp）

最新推荐文章于 2020-12-29 16:44:09 发布

Fat_tu

最新推荐文章于 2020-12-29 16:44:09 发布

阅读量321

点赞数

分类专栏：概率期望 dp 文章标签： dp

本文链接：https://blog.csdn.net/q582116859/article/details/78468312

版权

dp 同时被 2 个专栏收录

24 篇文章 1 订阅

订阅专栏

概率期望

2 篇文章 0 订阅

订阅专栏

好像noip一眼看去，全是dp。
题面
题意：有k个回合，n个物品，每回合随机掉一个物品i，有P[i]的价值。可以选择捡或不捡。对于每件物品，若想捡它，都要捡完它的先决物品，问最大期望价值。n≤15，k≤100。

大概就是个状压dp，用f[S][i]表示i回合选了集合S的物品，所得到的最大期望。
若每回合都必须选，k回合后得到的每个状态的概率才是可算的。但由于策略原因，到达最终的每个状态的概率并不可知，无法计算对答案的贡献。所以这题用逆推。（其实我也是看dalao题解知道的…）

所以，用f[S][i]表示i回合选了集合S的物品，再经过k-i个回合，所能得到的最大期望。

考虑第i+1个回合，掉每件物品的概率都是 $\frac1n$ 。
枚举会掉的物品j，若S中并不包含j的全部先决物品，有
$f[S][i]+=\frac 1nf[S][i+1]$
否则
$f[S][i]+=\frac 1nmax(f[S|(1<<j)][i+1]+p[j],f[S][i+1])$

f[0][1]为答案。

#include <iostream>
#include <fstream>
#include <algorithm>
#include <cmath>
#include <ctime>
#include <cstdio>
#include <cstdlib>
#include <cstring>

using namespace std;
#define mmst(a, b) memset(a, b, sizeof(a))
#define mmcp(a, b) memcpy(a, b, sizeof(b))

typedef long long LL;

int n,k,er[22];
int need[22],val[22];
double f[103][40040];

int main()
{
    er[0]=1;
    for(int i=1;i<=20;i++)
    er[i]=er[i-1]*2;

    cin>>k>>n;
    for(int i=1;i<=n;i++)
    {
        scanf("%d",&val[i]);
        int x;
        scanf("%d",&x);
        while(x)
        {
            need[i]|=er[x-1];
            scanf("%d",&x);
        }
    }

    for(int i=k;i>=1;i--)
    for(int s=0;s<er[n];s++)
    {
        for(int j=1;j<=n;j++)
        if((s&need[j])==need[j])
        f[i][s]+=max(f[i+1][s],f[i+1][s|er[j-1]]+val[j]);
        else
        f[i][s]+=f[i+1][s];

        f[i][s]/=n;
    }
    printf("%.6lf\n",f[1][0]);

    return 0;
}