题目大意:n个硬币从左到右,第i个价值为Ci,A和B轮流拿硬币,但是每次只能从两边拿硬币。A先开始拿,两个人都采取最优策略,问A最多可拿到多少硬币?(n<=5000)
题解:博弈dp
设f[i][j]表示从区间[i,j]得到的最大价值,则有:f[i][j]=max(a[i]+sum[i+1][j]-f[i+1][j],a[j]+sum[i][j-1]-f[i][j-1])
理解如下:
对[i,j]区间,A要么选i要们选j,如果选i那么剩下的区间[i+1,j]就必须B选,注意B也是最优选择,所以A在剩下区间[i+1,j]选的总和为sum[i+1][j]-f[i+1][j](即减去B最优选的)。
A选j时分析同上。
但是这个题内存有限制,需要降维。
sum[i][j]换为前缀和,f[i][j]需要转成按长度来推的dp,f[len][i]表示从i开始长度为len的区间。
f[len][i]=maxc[i]+s[i+len-1]-s[i]-f[len-1][i+1],c[i+len-1]+s[i+len-2]-s[i-1]-f[len-1][i])
然后len维可以降下去。
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
int f[6001],s[6001],c[6001];
int main()
{
int n;
while(cin>>n)
{
memset(s,0,sizeof(s));
memset(c,0,sizeof(c));
memset(f,0,sizeof(f));
for(int i=1;i<=n;i++)
{
cin>>c[i];
s[i]=s[i-1]+c[i];
f[i]=c[i];
}
for(int len=2;len<=n;len++)
for(int i=1;i<=n-len+1;i++)
f[i]=max(c[i]+s[i+len-1]-s[i]-f[i+1],c[i+len-1]+s[i+len-2]-s[i-1]-f[i]);
cout<<f[1]<<"\n";
}
return 0;
}