从数据范围和先决条件这两个东西可以看出要状压
顺推发现那个当前要决定吃还是不吃,决定不出后以后都不能再吃完全不知道怎么处理。
然后看了题解,有人说这种中间要抉择最优策略一般都是从后往前推
f[i][s]表示从第i天到第k天,第i天已有宝物为s的时候,能增加的价值的期望
假设当前新增宝物为j而且j是可吃的话 f[i][s]+=max(f[i+1][s],f[i+1][s|1<<(j-1)]+a[j])/n;
不可吃的话f[i][s]+=f[i+1][s]/n
上面那个顺推无法处理的问题,假设f[i+1][s]要更大一些的话,首先说明a[j]是负数,其次说明由于加了a[j]导致无论后面怎么选择,期望都不会比不选a[j]要大,那么这就相当于这里不选a[j],后面也不可能加a[j]了,因为后面选择了a[j]后,剩下的选择次数比现在更少,更不可能弥补a[j]造成的损失。
#include<bits/stdc++.h>
#define maxl 110
using namespace std;
int k,n,len;
int a[maxl],pre[maxl];
double ans;
double f[maxl][1<<15];
inline void prework()
{
scanf("%d%d",&k,&n);
int x;
for(int i=1;i<=n;i++)
{
scanf("%d",&a[i]);
while(scanf("%d",&x) && x)
pre[i]|=1<<(x-1);
}
}
inline void mainwork()
{
f[0][0]=1;
len=1<<n;int t;
for(int i=k;i>=1;i--)
for(int s=0;s<len;s++)
for(int j=1;j<=n;j++)
{
t=s|(1<<(j-1));
if((s&pre[j])==pre[j])
f[i][s]+=max(f[i+1][t]+a[j],f[i+1][s])/n;
else
f[i][s]+=f[i+1][s]/n;
}
}
inline void print()
{
ans=0;double sum=0;
printf("%.6f\n",f[1][0]);
}
int main()
{
prework();
mainwork();
print();
return 0;
}