Codeforces Round 767 (Div. 1) D2. Game on Sum (Hard Version)(博弈 期望 dp 贡献)

文章讨论了一个在线编程竞赛中的问题,涉及Alice和Bob在一轮游戏中选择加减分数的策略,目标是最大化Alice的期望总分和最小化Bob的期望总分。通过动态规划方法,特别是利用杨辉三角和转移式,计算在特定条件下总分的期望值。
摘要由CSDN通过智能技术生成

题目

t(t<=1e5)组样例,每次给定n,m,k(m<=n<=1e6,0<=k<1e9+7)

有一个游戏,持续n轮,每轮Alice先选一个[0,k]的实数,

Bob决定从总分里加上这个值还是减去这个值

特别地,n轮里,Bob选择加上的次数不得少于m次

每次都是Alice先选值,选完之后Bob决策,

Alice下一轮选值的时候,是知道上一轮Bob决策结果的

Alice想让这个总分最大,Bob想让这个总分最小,

求二人都最优策略时总分的期望,答案对1e9+7取模

思路来源

官方题解

题解

先把k提出来,转化成[0,1]的实数,最后乘上k

dp[i][j]表示还剩i局bob必须加j局时alice的最大分数期望

根据转移式,alice先选择一个k,

然后bob会选择更小的那个转移,

有dp[i][j]=min(dp[i-1][j]-k,dp[i-1][j-1]+k)

所以alice会这样选择k,使得两部分相等,有dp[i-1][j]-k=dp[i-1][j-1]+k,

有dp[i][j]=(dp[i-1][j]-k+dp[i-1][j-1]+k)/2=(dp[i-1][j]+dp[i-1][j-1])/2

终态dp[i][i]=i,即必须加i轮时,每轮都加1即可

图形是一个杨辉三角图形,考虑每个(i,i)的贡献,即(i,i)到(n,m)的路径条数

第一步(i,i)只能向下,因为(i,i)和(i-1,i-1)之间不再满足dp关系式,是O(1)求的dp[i][i]=i

①(n,m)是一个对角线点,即(n,m)=(i,i),ans=i

②(n,m)不是对角线点,枚举i<n,从(i,i)到(n,m)的路径,由于第一步只能往下

即(i+1,i)到(n,m)的路径,每一步要么令x加1,要么令x和y都加1,

即n-1-i步中选m-i步令y加1,每一次x加1都乘了1/2的系数,

所以,dp[i][i]的贡献是C_{n-1-i}^{m-i}*(\frac{1}{2})^{n-i}

代码1(easy)

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair<ll,int> P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<<x<<" ";
#define dbg2(x) cerr<<(#x)<<":"<<x<<endl;
#define SZ(a) (int)(a.size())
#define sci(a) scanf("%d",&(a))
#define scll(a) scanf("%lld",&(a))
#define pt(a) printf("%d",a);
#define pte(a) printf("%d\n",a)
#define ptlle(a) printf("%lld\n",a)
#define debug(...) fprintf(stderr, __VA_ARGS__)
const int N=2e3+10,mod=1e9+7;
int t,n,m,k,inv2[N],dp[N][N];
int Finv[N],fac[N],inv[N];
int modpow(int x,int n,int mod){
	int res=1;
	for(;n;x=1ll*x*x%mod,n>>=1)
	if(n&1)res=1ll*res*x%mod;
	return res;
}
void init(int n){ //n<N
    inv[1]=1;
    inv2[0]=1;
    inv2[1]=(mod+1)/2;
    for(int i=2;i<=n;++i){
    	inv[i]=1ll*(mod-mod/i)*inv[mod%i]%mod;
    	inv2[i]=1ll*inv2[i-1]*inv2[1]%mod;
    }
	fac[0]=Finv[0]=1;
	for(int i=1;i<=n;++i)fac[i]=1ll*fac[i-1]*i%mod,Finv[i]=1ll*Finv[i-1]*inv[i]%mod;
	//Finv[n]=modpow(fac[n],mod-2,mod);
	//for(int i=n-1;i>=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){
	if(m<0||m>n)return 0;
	return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){
	sci(n),sci(m),sci(k);
	rep(i,1,n){
		dp[i][i]=i;
		rep(j,1,i-1){
			dp[i][j]=1ll*(dp[i-1][j]+dp[i-1][j-1])*inv2[1]%mod;
		}
	}
	printf("%d\n",1ll*dp[n][m]*k%mod);
}
int main(){
	init(N-1);
	sci(t); // t=1
	while(t--){
		sol();
	}
	return 0;
}

代码2(hard)

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair<ll,int> P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<<x<<" ";
#define dbg2(x) cerr<<(#x)<<":"<<x<<endl;
#define SZ(a) (int)(a.size())
#define sci(a) scanf("%d",&(a))
#define scll(a) scanf("%lld",&(a))
#define pt(a) printf("%d",a);
#define pte(a) printf("%d\n",a)
#define ptlle(a) printf("%lld\n",a)
#define debug(...) fprintf(stderr, __VA_ARGS__)
const int N=1e6+10,mod=1e9+7;
int t,n,m,k,inv2[N];
int Finv[N],fac[N],inv[N];
int modpow(int x,int n,int mod){
	int res=1;
	for(;n;x=1ll*x*x%mod,n>>=1)
	if(n&1)res=1ll*res*x%mod;
	return res;
}
void init(int n){ //n<N
    inv[1]=1;
    inv2[0]=1;
    inv2[1]=(mod+1)/2;
    for(int i=2;i<=n;++i){
    	inv[i]=1ll*(mod-mod/i)*inv[mod%i]%mod;
    	inv2[i]=1ll*inv2[i-1]*inv2[1]%mod;
    }
	fac[0]=Finv[0]=1;
	for(int i=1;i<=n;++i)fac[i]=1ll*fac[i-1]*i%mod,Finv[i]=1ll*Finv[i-1]*inv[i]%mod;
	//Finv[n]=modpow(fac[n],mod-2,mod);
	//for(int i=n-1;i>=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){
	if(m<0||m>n)return 0;
	return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){
	sci(n),sci(m),sci(k);
	int ans=0;//dp[i][j]表示还剩i局还能加j次的最大期望
	if(n==m){
		ans=n;
	}
	else{
		rep(i,0,n-1){//枚举(i,i)到(n,m)的路径 dp[i][i]=i*k
			ans=(ans+1ll*C(n-i-1,m-i)*i%mod*inv2[n-i])%mod;
		}
	}
	ans=1ll*ans*k%mod;
	printf("%d\n",ans);
}
int main(){
	init(N-1);
	sci(t); // t=1
	while(t--){
		sol();
	}
	return 0;
}

  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Code92007

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值