[[SCOI2008]奖励关][状压+期望dp]

传送门

题意:有n种卡(n<=15),k轮游戏,每轮游戏可以抽一张卡(每一轮抽出每种卡的概率都是1/n),卡的价值为ai(ai可以为负数),并且某些卡需要另一些卡作为引导即只有在得到某些卡的时候才能获得这些卡,每轮游戏抽到的卡可以选择获得(前提是前驱卡已经获得)或者不获得,求选择最优策略的情况下的总价值的期望。
题解:显然可以使用比较容易理解的记忆化搜索解决,定义dp[i][j]为第i轮状态为j时,剩下操作能产生的最大价值,结果就是dp[1][0]
记忆化搜索

#include<bits/stdc++.h>

using namespace std;
#define debug(x) cout<<#x<<" is "<<x<<endl;
typedef long long ll;

const int maxn=1e3+5;

double dp[105][(1<<15)];
bool vis[105][(1<<15)];
ll a[21],w[21];
int n,k;

double dfs(int x,int y){
    if(vis[x][y])return dp[x][y];
    if(x==k+1)return 0;
    dp[x][y]=0;
    for(int i=0;i<n;i++){
        if((y&w[i])==w[i]){
            if(a[i]>=0){
                dp[x][y]+=a[i]+dfs(x+1,y|(1<<i));
            }
            else{
                dp[x][y]+=max(a[i]+dfs(x+1,y|(1<<i)),dfs(x+1,y));
            }
        }
        else{
            dp[x][y]+=dfs(x+1,y);
        }
    }
    vis[x][y]=1;
    dp[x][y]/=n;
    return dp[x][y];
}

int main(){
    scanf("%d%d",&k,&n);
    for(int i=0;i<(1<<n);i++){
        for(int j=0;j<=k;j++){
            vis[j][i]=0;
        }
    }
    for(int i=0;i<n;i++){
        scanf("%lld",&a[i]);
        int x;
        scanf("%d",&x);
        while(x){
            w[i]|=(1<<(x-1));
            scanf("%d",&x);
        }
    }
    printf("%.6f\n",dfs(1,0));
    return 0;
}

也可以直接找出转移方程直接dp(注意由于终点的状态不唯一,而起点的状态唯一,所以倒着进行dp就可以避免讨论非法情况(可以这么理解,由于终点状态不确定,所以不管从哪里开始往起点转移都是可以的,而正着转移的状态必须是以0为起点的,那么就需要特别判断用于转移的状态是否是从起点来的,这增加了不必要的麻烦(通常正着转移的时候要使用一个特殊值标记未被转移的状态避免用非法状态转移)))

#include<bits/stdc++.h>

using namespace std;
#define debug(x) cout<<#x<<" is "<<x<<endl;
typedef long long ll;

const int maxn=1e3+5;

double dp[105][(1<<15)];
ll a[21],w[21];
int n,k;

int main(){
    scanf("%d%d",&k,&n);
    for(int i=0;i<n;i++){
        scanf("%lld",&a[i]);
        int x;
        scanf("%d",&x);
        while(x){
            w[i]|=(1<<(x-1));
            scanf("%d",&x);
        }
    }

    for(int i=k;i>=1;i--){
        for(int j=0;j<(1<<n);j++){
            for(int s=0;s<n;s++){
                if((w[s]&j)==w[s]){
                    dp[i][j]+=max(dp[i+1][j],dp[i+1][j|(1<<s)]+a[s]);
                }
                else dp[i][j]+=dp[i+1][j];
            }
            dp[i][j]/=n;
        }
    }
    printf("%.6f\n",dp[1][0]);
    return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值