[BZOJ1076][SCOI2008]奖励关(状压DP)

很明显是一道状压。 DP 模型很容易想到,用 f[i][S] 表示到了第 i 轮,宝物是否取过的状态为S的最大期望得分。
但这个模型存在问题:可能在第 i 轮无法到达状态S
所以,这里把定义换一下, f[i][S] 表示在第 1 轮到第i1轮内宝物是否取过的状态为 S ,第i轮到第 K 轮的最大期望得分,那么这样就可以通过逆推进行转移了。
转移方程为:
对于任意一个1<=k<=n
1、如果 S 包含的状态满足取第k种宝物的条件,则可以取或不取。不取则为 f[i+1][S] ,取则为 f[i+1][S|(1<<k1)]+Pk
所以此时 f[i][S]+=max(f[i+1][S],f[i+1][S|(1<<k1)]+Pk)
2、如果 S 包含的状态不满足取第k种宝物的条件,则不能取,即 f[i][S]+=f[i+1][S]
而这里求的是期望值,上面求的东西覆盖了第 i 轮取了所有n种宝物的情况,所以在每一个状态计算完之后,把 f[i][S] 除以 n 即为期望平均值。
最后答案为f[1][0]
代码:

#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
inline int read() {
    int res = 0; bool bo = 0; char c;
    while (((c = getchar()) < '0' || c > '9') && c != '-');
    if (c == '-') bo = 1; else res = c - 48;
    while ((c = getchar()) >= '0' && c <= '9')
        res = (res << 3) + (res << 1) + (c - 48);
    return bo ? ~res + 1 : res;
}
const int M = 105, N = 17;
int K, n, p[N], sta[N];
double f[M][1 << 15];
void chkmax(double &a, double b) {a = max(a, b);}
int main() {
    int i, j, k, x; K = read(); n = read();
    for (i = 1; i <= n; i++) {
        p[i] = read(); while (x = read())
            sta[i] = sta[i] | (1 << x - 1);
    }
    for (i = K; i >= 1; i--) for (j = 0; j < (1 << n); j++) {
        for (k = 1; k <= n; k++) if ((j & sta[k]) == sta[k])
            f[i][j] += max(f[i + 1][j], f[i + 1][j | (1 << k - 1)] + p[k]);
        else f[i][j] += f[i + 1][j];
        f[i][j] /= n;
    }
    printf("%.6lf\n", f[1][0]);
    return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值