大致题意:总共有 n n n个宝物和 k k k个回合,每个回合系统将随机抛出一个宝物(抛出每个宝物的概率皆为 1 / n 1/n 1/n),吃掉一个宝物可以获得一定的积分(积分可能为负),而吃掉某个宝物有一定的前提,即先吃掉若干种宝物每个至少一次,才能吃掉该宝物。请你求出在最优策略的情况下的最优得分。
状压 D P DP DP
由于这道题的数据范围很小,我们可以考虑状压 D P DP DP,状压DP就是用一个数二进制下的每一位来存储一个信息,这里就用来存储某个宝物是否被吃掉过。
我们可以用 f [ i ] [ j ] f[i][j] f[i][j]记录第 i i i个回合,当前状态为 j j j时能获得的最大收益。
如果我们正着DP,那么显然可以发现,当我们要从一个状态转移至另一个状态时,有可能前一个状态无法得到,因此我们要倒着推。
这样,我们就能得出DP转移方程:
f[i][j]+=max(f[i+1][j],f[i+1][j|(1<<(q-1))]+a[q]);
其中,我们要满足当前状态 j j j满足吃掉宝物 q q q所需的条件,然后枚举每一个符合条件的 j j j即可。
注意,要判断当前状态 j j j是否满足条件,有个很简单的方法:判断 j j j& s [ q ] s[q] s[q]( s [ q ] s[q] s[q]存储吃掉宝物 q q q所需的条件,这里也利用了状态压缩)是否等于 s [ q ] s[q] s[q],如果相等,便说明 j j j这个状态中包含了 s [ q ] s[q] s[q],即说明当前状态满足吃掉宝物 q q q所需的条件。
状压 D P DP DP
#include<bits/stdc++.h>
#define N 15
#define K 100
using namespace std;
int n,k,a[N+5],s[N+5];
double f[K+5][(1<<N)+5];
inline char tc()
{
static char ff[100000],*A=ff,*B=ff;
return A==B&&(B=(A=ff)+fread(ff,1,100000,stdin),A==B)?EOF:*A++;
}
inline void read(int &x)
{
x=0;int f=1;char ch;
while(!isdigit(ch=tc())) f=ch^'-'?1:-1;
while(x=(x<<3)+(x<<1)+ch-'0',isdigit(ch=tc()));
x*=f;
}
int main()
{
register int i,j,q;
for(read(k),read(n),i=1;i<=n;++i)
for(read(a[i]),read(j),s[i]=0;j;read(j))
s[i]|=1<<(j-1);//用状态压缩将吃掉宝物所需的条件存储下来
for(i=k;i;--i)//倒着进行DP
for(j=0;j<(1<<n);++j)
{
for(q=1;q<=n;++q)
{
if((j&s[q])==s[q]) f[i][j]+=max(f[i+1][j],f[i+1][j|(1<<(q-1))]+a[q]);//判断是否满足条件,更新答案
else f[i][j]+=f[i+1][j];
}
f[i][j]/=n;//由于每种情况的概率是1/n,所以要除以n
}
return printf("%.6lf",f[1][0]),0;
}