Codeforces Round 767 (Div. 1) D2. Game on Sum (Hard Version)（博弈期望 dp 贡献）

最新推荐文章于 2024-07-16 11:49:50 发布

Code92007

最新推荐文章于 2024-07-16 11:49:50 发布

阅读量463

点赞数 8

分类专栏： # 概率dp/期望/概率博弈文章标签：博弈期望 dp

本文链接：https://blog.csdn.net/Code92007/article/details/135687656

版权

概率dp/期望/概率同时被 2 个专栏收录

28 篇文章 2 订阅

订阅专栏

博弈

21 篇文章 0 订阅

订阅专栏

文章讨论了一个在线编程竞赛中的问题，涉及Alice和Bob在一轮游戏中选择加减分数的策略，目标是最大化Alice的期望总分和最小化Bob的期望总分。通过动态规划方法，特别是利用杨辉三角和转移式，计算在特定条件下总分的期望值。

摘要由CSDN通过智能技术生成

题目

t(t<=1e5)组样例，每次给定n,m,k(m<=n<=1e6，0<=k<1e9+7)

有一个游戏，持续n轮，每轮Alice先选一个[0,k]的实数，

Bob决定从总分里加上这个值还是减去这个值

特别地，n轮里，Bob选择加上的次数不得少于m次

每次都是Alice先选值，选完之后Bob决策，

Alice下一轮选值的时候，是知道上一轮Bob决策结果的

Alice想让这个总分最大，Bob想让这个总分最小，

求二人都最优策略时总分的期望，答案对1e9+7取模

思路来源

官方题解

题解

先把k提出来，转化成[0,1]的实数，最后乘上k

dp[i][j]表示还剩i局bob必须加j局时alice的最大分数期望

根据转移式，alice先选择一个k，

然后bob会选择更小的那个转移，

有dp[i][j]=min(dp[i-1][j]-k,dp[i-1][j-1]+k)

所以alice会这样选择k，使得两部分相等，有dp[i-1][j]-k=dp[i-1][j-1]+k，

有dp[i][j]=(dp[i-1][j]-k+dp[i-1][j-1]+k)/2=(dp[i-1][j]+dp[i-1][j-1])/2

终态dp[i][i]=i，即必须加i轮时，每轮都加1即可

图形是一个杨辉三角图形，考虑每个(i,i)的贡献，即(i,i)到(n,m)的路径条数

第一步(i,i)只能向下，因为(i,i)和(i-1,i-1)之间不再满足dp关系式，是O(1)求的dp[i][i]=i

①(n,m)是一个对角线点，即(n,m)=(i,i)，ans=i

②(n,m)不是对角线点，枚举i<n，从(i,i)到(n,m)的路径，由于第一步只能往下

即(i+1,i)到(n,m)的路径，每一步要么令x加1，要么令x和y都加1，

即n-1-i步中选m-i步令y加1，每一次x加1都乘了1/2的系数，

所以，dp[i][i]的贡献是 $C_{n-1-i}^{m-i}*(\frac{1}{2})^{n-i}$

代码1（easy）

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair<ll,int> P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<<x<<" ";
#define dbg2(x) cerr<<(#x)<<":"<<x<<endl;
#define SZ(a) (int)(a.size())
#define sci(a) scanf("%d",&(a))
#define scll(a) scanf("%lld",&(a))
#define pt(a) printf("%d",a);
#define pte(a) printf("%d\n",a)
#define ptlle(a) printf("%lld\n",a)
#define debug(...) fprintf(stderr, __VA_ARGS__)
const int N=2e3+10,mod=1e9+7;
int t,n,m,k,inv2[N],dp[N][N];
int Finv[N],fac[N],inv[N];
int modpow(int x,int n,int mod){
	int res=1;
	for(;n;x=1ll*x*x%mod,n>>=1)
	if(n&1)res=1ll*res*x%mod;
	return res;
}
void init(int n){ //n<N
    inv[1]=1;
    inv2[0]=1;
    inv2[1]=(mod+1)/2;
    for(int i=2;i<=n;++i){
    	inv[i]=1ll*(mod-mod/i)*inv[mod%i]%mod;
    	inv2[i]=1ll*inv2[i-1]*inv2[1]%mod;
    }
	fac[0]=Finv[0]=1;
	for(int i=1;i<=n;++i)fac[i]=1ll*fac[i-1]*i%mod,Finv[i]=1ll*Finv[i-1]*inv[i]%mod;
	//Finv[n]=modpow(fac[n],mod-2,mod);
	//for(int i=n-1;i>=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){
	if(m<0||m>n)return 0;
	return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){
	sci(n),sci(m),sci(k);
	rep(i,1,n){
		dp[i][i]=i;
		rep(j,1,i-1){
			dp[i][j]=1ll*(dp[i-1][j]+dp[i-1][j-1])*inv2[1]%mod;
		}
	}
	printf("%d\n",1ll*dp[n][m]*k%mod);
}
int main(){
	init(N-1);
	sci(t); // t=1
	while(t--){
		sol();
	}
	return 0;
}

代码2（hard）

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair<ll,int> P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<<x<<" ";
#define dbg2(x) cerr<<(#x)<<":"<<x<<endl;
#define SZ(a) (int)(a.size())
#define sci(a) scanf("%d",&(a))
#define scll(a) scanf("%lld",&(a))
#define pt(a) printf("%d",a);
#define pte(a) printf("%d\n",a)
#define ptlle(a) printf("%lld\n",a)
#define debug(...) fprintf(stderr, __VA_ARGS__)
const int N=1e6+10,mod=1e9+7;
int t,n,m,k,inv2[N];
int Finv[N],fac[N],inv[N];
int modpow(int x,int n,int mod){
	int res=1;
	for(;n;x=1ll*x*x%mod,n>>=1)
	if(n&1)res=1ll*res*x%mod;
	return res;
}
void init(int n){ //n<N
    inv[1]=1;
    inv2[0]=1;
    inv2[1]=(mod+1)/2;
    for(int i=2;i<=n;++i){
    	inv[i]=1ll*(mod-mod/i)*inv[mod%i]%mod;
    	inv2[i]=1ll*inv2[i-1]*inv2[1]%mod;
    }
	fac[0]=Finv[0]=1;
	for(int i=1;i<=n;++i)fac[i]=1ll*fac[i-1]*i%mod,Finv[i]=1ll*Finv[i-1]*inv[i]%mod;
	//Finv[n]=modpow(fac[n],mod-2,mod);
	//for(int i=n-1;i>=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){
	if(m<0||m>n)return 0;
	return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){
	sci(n),sci(m),sci(k);
	int ans=0;//dp[i][j]表示还剩i局还能加j次的最大期望
	if(n==m){
		ans=n;
	}
	else{
		rep(i,0,n-1){//枚举(i,i)到(n,m)的路径 dp[i][i]=i*k
			ans=(ans+1ll*C(n-i-1,m-i)*i%mod*inv2[n-i])%mod;
		}
	}
	ans=1ll*ans*k%mod;
	printf("%d\n",ans);
}
int main(){
	init(N-1);
	sci(t); // t=1
	while(t--){
		sol();
	}
	return 0;
}

Code92007

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
Codeforces Round 767 (Div. 1) D2. Game on Sum (Hard Version)（博弈期望 dp 贡献）

有dp[i][j]=(dp[i-1][j]-k+dp[i-1][j-1]+k)/2=(dp[i-1][j]+dp[i-1][j-1])/2。第一步(i,i)只能向下，因为(i,i)和(i-1,i-1)之间不再满足dp关系式，是O(1)求的dp[i][i]=i。所以alice会这样选择k，使得两部分相等，有dp[i-1][j]-k=dp[i-1][j-1]+k，有dp[i][j]=min(dp[i-1][j]-k,dp[i-1][j-1]+k)终态dp[i][i]=i，即必须加i轮时，每轮都加1即可。
复制链接

扫一扫