题意:有n种卡(n<=15),k轮游戏,每轮游戏可以抽一张卡(每一轮抽出每种卡的概率都是1/n),卡的价值为ai(ai可以为负数),并且某些卡需要另一些卡作为引导即只有在得到某些卡的时候才能获得这些卡,每轮游戏抽到的卡可以选择获得(前提是前驱卡已经获得)或者不获得,求选择最优策略的情况下的总价值的期望。
题解:显然可以使用比较容易理解的记忆化搜索解决,定义dp[i][j]为第i轮状态为j时,剩下操作能产生的最大价值,结果就是dp[1][0]
记忆化搜索
#include<bits/stdc++.h>
using namespace std;
#define debug(x) cout<<#x<<" is "<<x<<endl;
typedef long long ll;
const int maxn=1e3+5;
double dp[105][(1<<15)];
bool vis[105][(1<<15)];
ll a[21],w[21];
int n,k;
double dfs(int x,int y){
if(vis[x][y])return dp[x][y];
if(x==k+1)return 0;
dp[x][y]=0;
for(int i=0;i<n;i++){
if((y&w[i])==w[i]){
if(a[i]>=0){
dp[x][y]+=a[i]+dfs(x+1,y|(1<<i));
}
else{
dp[x][y]+=max(a[i]+dfs(x+1,y|(1<<i)),dfs(x+1,y));
}
}
else{
dp[x][y]+=dfs(x+1,y);
}
}
vis[x][y]=1;
dp[x][y]/=n;
return dp[x][y];
}
int main(){
scanf("%d%d",&k,&n);
for(int i=0;i<(1<<n);i++){
for(int j=0;j<=k;j++){
vis[j][i]=0;
}
}
for(int i=0;i<n;i++){
scanf("%lld",&a[i]);
int x;
scanf("%d",&x);
while(x){
w[i]|=(1<<(x-1));
scanf("%d",&x);
}
}
printf("%.6f\n",dfs(1,0));
return 0;
}
也可以直接找出转移方程直接dp(注意由于终点的状态不唯一,而起点的状态唯一,所以倒着进行dp就可以避免讨论非法情况(可以这么理解,由于终点状态不确定,所以不管从哪里开始往起点转移都是可以的,而正着转移的状态必须是以0为起点的,那么就需要特别判断用于转移的状态是否是从起点来的,这增加了不必要的麻烦(通常正着转移的时候要使用一个特殊值标记未被转移的状态避免用非法状态转移)))
#include<bits/stdc++.h>
using namespace std;
#define debug(x) cout<<#x<<" is "<<x<<endl;
typedef long long ll;
const int maxn=1e3+5;
double dp[105][(1<<15)];
ll a[21],w[21];
int n,k;
int main(){
scanf("%d%d",&k,&n);
for(int i=0;i<n;i++){
scanf("%lld",&a[i]);
int x;
scanf("%d",&x);
while(x){
w[i]|=(1<<(x-1));
scanf("%d",&x);
}
}
for(int i=k;i>=1;i--){
for(int j=0;j<(1<<n);j++){
for(int s=0;s<n;s++){
if((w[s]&j)==w[s]){
dp[i][j]+=max(dp[i+1][j],dp[i+1][j|(1<<s)]+a[s]);
}
else dp[i][j]+=dp[i+1][j];
}
dp[i][j]/=n;
}
}
printf("%.6f\n",dp[1][0]);
return 0;
}