hdu-4597 (博弈DP)

该题是用dp推导博弈题的经典例子 , 仔细想想就会发现,这其实就是一个区间处理的问题 ,一般区间问题还是比较简单的一类题目 。

由于两个孩子都很聪明,所以他们一定都尽可能的选择最优方案,所以每个人当前的最优解都依赖于下一个人的最优解 。    那么怎么处理细节呢 ? 还是老调重弹,先想状态如何表示,再想状态如何转移 。

很显然,要想完整的描述状态,我们必须开四维数组,记录两堆牌当前的状态 。  那么状态不难表示成  d[al][ar][bl][br] , 表示两堆牌当前的首尾情况下,所能获得的最大分数 ,那么状态如何转移呢?

前面说了,当前最优解依赖于之前的最优解,因为两个孩子都很聪明 。 推DP要时刻注意状态表示的是什么,刚才说了表示该孩子的最大分数,那么怎么求呢? 显然等于总分减去下一个孩子的得分,下一个孩子的”总分“就要减去当前孩子拿走的牌 。

细节参见代码:

#include<bits/stdc++.h>
using namespace std;
int T,n,d[25][25][25][25],a[25],b[25];
int dp(int al,int ar,int bl,int br,int sum) {
    int& ans = d[al][ar][bl][br];
    if(ans != -1) return ans;
    ans = 0;
    if(al<=ar) {
        ans = max(ans,sum-dp(al+1,ar,bl,br,sum-a[al]));
        ans = max(ans,sum-dp(al,ar-1,bl,br,sum-a[ar]));
    }
    if(bl<=br) {
        ans = max(ans,sum-dp(al,ar,bl+1,br,sum-b[bl]));
        ans = max(ans,sum-dp(al,ar,bl,br-1,sum-b[br]));
    }
    return ans;
}
int main() {
    scanf("%d",&T);
    while(T--) {
        scanf("%d",&n);
        int sum = 0;
        memset(d,-1,sizeof(d));
        for(int i=1;i<=n;i++) scanf("%d",&a[i]) , sum += a[i];
        for(int i=1;i<=n;i++) scanf("%d",&b[i]) , sum += b[i];
        int ans = dp(1,n,1,n,sum);
        printf("%d\n",ans);
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值