ZJU1607 Varacious Steve - 博弈&动态规划★-CSDN博客

本文链接：https://blog.csdn.net/tiaotiaoyly/article/details/2700118

题目描述：

游戏者AB分享N个面包圈，由A开始轮流取面包，每次不超过M个。当某人取得最后一个面包圈时为胜利者。胜利者可以吃掉已经取得的面包圈，失败者将自己取得的面包圈拿出来重新开始游戏，并由失败者开始取。假设AB两人都使用最佳决策，问A最多能吃到多少面包圈。

题目分析：

想了好久，DP思路还是不清晰，在网上搜了一下才豁然开朗。不过网上那个公式比较冗余，我把他的公式降了一维下来。

设f[s][d][r]表示当前游戏者取得s个，对手取得d个，剩余r个面包圈时，当前游戏者最终最多能吃到面包圈的数量。

当r>m时，f[s][d][r] = max{ s+d+r - f[d][s+k][r-k] (1<=k<=m) }，当前游戏者不能一次将剩下的都取走；

当r<=m时，f[s][d][r] = s+d+r - f[0][0][d]，当前游戏者可以取走剩下的面包圈获得胜利，开始新的一轮。

后记：

开始考虑的时候，列的方程太宏观了，似乎以前很多次都是这样。

有时候表示的状态不能有效地写出递推或递归方程的时候，一定要考虑增加状态表示的维度！

/*
ZJU1607 Varacious Steve
*/

#include 
 
 
  
  
#include 
  
  
   
   

#define N 105
#define clr(a) memset(a,0,sizeof(a))

int n,m;
int f[N][N][N] = {0};
//f[s][d][r]表示当前游戏者取得s个、对手取得d个，剩余r个时，最终能获得的最大数目。

int MAX(int a,int b){
    return a>b?a:b;
}

int F(int s,int d,int r){
    if(f[s][d][r]) return f[s][d][r];
    
    if(r<=m){
        if(s==0 && d==0) f[s][d][r] = r;
        else f[s][d][r] = s+d+r-F(0,0,d);
    }
    else{
        int k;
        for(k=1;k<=m;k++){
            f[s][d][r] = MAX(f[s][d][r], s+d+r-F(d,s+k,r-k));
        }
    }
    return f[s][d][r];
}

int main()
{
    int i,j,k;

    while(scanf("%d%d",&n,&m)!=EOF){
        clr(f);
        printf("%d/n",F(0,0,n));
    }
    
    return 0;
}