ZJU1607 Varacious Steve - 博弈&动态规划★

题目描述:

游戏者AB分享N个面包圈,由A开始轮流取面包,每次不超过M个。当某人取得最后一个面包圈时为胜利者。胜利者可以吃掉已经取得的面包圈,失败者将自己取得的面包圈拿出来重新开始游戏,并由失败者开始取。假设AB两人都使用最佳决策,问A最多能吃到多少面包圈。

 

题目分析:

想了好久,DP思路还是不清晰,在网上搜了一下才豁然开朗。不过网上那个公式比较冗余,我把他的公式降了一维下来。

设f[s][d][r]表示当前游戏者取得s个,对手取得d个,剩余r个面包圈时,当前游戏者最终最多能吃到面包圈的数量。

当r>m时f[s][d][r] = max{ s+d+r - f[d][s+k][r-k] (1<=k<=m) },当前游戏者不能一次将剩下的都取走

当r<=m时f[s][d][r] = s+d+r - f[0][0][d],当前游戏者可以取走剩下的面包圈获得胜利,开始新的一轮

 

后记:

开始考虑的时候,列的方程太宏观了,似乎以前很多次都是这样。

有时候表示的状态不能有效地写出递推或递归方程的时候,一定要考虑增加状态表示的维度

 

/*
ZJU1607 Varacious Steve
*/

#include 
 
 
  
  
#include 
  
  
   
   

#define N 105
#define clr(a) memset(a,0,sizeof(a))

int n,m;
int f[N][N][N] = {0};
//f[s][d][r]表示当前游戏者取得s个、对手取得d个,剩余r个时,最终能获得的最大数目。

int MAX(int a,int b){
    return a>b?a:b;
}

int F(int s,int d,int r){
    if(f[s][d][r]) return f[s][d][r];
    
    if(r<=m){
        if(s==0 && d==0) f[s][d][r] = r;
        else f[s][d][r] = s+d+r-F(0,0,d);
    }
    else{
        int k;
        for(k=1;k<=m;k++){
            f[s][d][r] = MAX(f[s][d][r], s+d+r-F(d,s+k,r-k));
        }
    }
    return f[s][d][r];
}

int main()
{
    int i,j,k;

    while(scanf("%d%d",&n,&m)!=EOF){
        clr(f);
        printf("%d/n",F(0,0,n));
    }
    
    return 0;
}
  
  
 
 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值