BZOJ1076:奖励关(状压期望dp)

好像noip一眼看去,全是dp。
题面
题意:有k个回合,n个物品,每回合随机掉一个物品i,有P[i]的价值。可以选择捡或不捡。对于每件物品,若想捡它,都要捡完它的先决物品,问最大期望价值。n≤15,k≤100。

大概就是个状压dp,用f[S][i]表示i回合选了集合S的物品,所得到的最大期望。
若每回合都必须选,k回合后得到的每个状态的概率才是可算的。但由于策略原因,到达最终的每个状态的概率并不可知,无法计算对答案的贡献。所以这题用逆推。(其实我也是看dalao题解知道的…)

所以,用f[S][i]表示i回合选了集合S的物品,再经过k-i个回合,所能得到的最大期望。

考虑第i+1个回合,掉每件物品的概率都是 1n
枚举会掉的物品j,若S中并不包含j的全部先决物品,有
f[S][i]+=1nf[S][i+1]
否则
f[S][i]+=1nmax(f[S|(1<<j)][i+1]+p[j],f[S][i+1])

f[0][1]为答案。

#include <iostream>
#include <fstream>
#include <algorithm>
#include <cmath>
#include <ctime>
#include <cstdio>
#include <cstdlib>
#include <cstring>

using namespace std;
#define mmst(a, b) memset(a, b, sizeof(a))
#define mmcp(a, b) memcpy(a, b, sizeof(b))

typedef long long LL;

int n,k,er[22];
int need[22],val[22];
double f[103][40040];

int main()
{
    er[0]=1;
    for(int i=1;i<=20;i++)
    er[i]=er[i-1]*2;

    cin>>k>>n;
    for(int i=1;i<=n;i++)
    {
        scanf("%d",&val[i]);
        int x;
        scanf("%d",&x);
        while(x)
        {
            need[i]|=er[x-1];
            scanf("%d",&x);
        }
    }

    for(int i=k;i>=1;i--)
    for(int s=0;s<er[n];s++)
    {
        for(int j=1;j<=n;j++)
        if((s&need[j])==need[j])
        f[i][s]+=max(f[i+1][s],f[i+1][s|er[j-1]]+val[j]);
        else
        f[i][s]+=f[i+1][s];

        f[i][s]/=n;
    }
    printf("%.6lf\n",f[1][0]);

    return 0;
}

这里写图片描述
珂学真是太好玩了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值