ACM-ICPC 2017 Asia Urumqi A.Coins【概率dp / 期望dp】

WA自动鸡

于 2021-03-23 22:24:08 发布

阅读量122

点赞数 1

分类专栏： DP

本文链接：https://blog.csdn.net/while_you/article/details/115144288

版权

DP 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

Link

概率dp/期望dp

前置

知识点：帕斯卡恒等式（组合数学）
在这里插入图片描述

题意

n个硬币初始朝下，掷m次，每次任意选k个投掷，问在采取最优策略下（使朝上硬币尽可能多），m次后朝上的硬币的数量的期望是多少？

分析

最优策略：尽可能的选朝下的硬币投掷
令dp[i][j]表示为投i次后有j个硬币朝上的概率
令x为第i次投掷完后，k个硬币中有x个朝上(0<=x<=k)
考虑转移方程。
由于采取最优策略，假设所取硬币全部朝下，则dp[i][j]对dp[i+1][j+x]有贡献。
假设由于朝下硬币数量过少，无法取到k个，则需由朝上硬币代替。所选朝下：n-j，所选朝上：k-(n-j)，则硬币朝上增加或减少x-(k-(n-j))。此时dp[i][j]对dp[i+1][j+x-(k-(n-j))]有贡献。
得方程

若n-j>=k
dp[i+1][j+x] += dp[i][j] * (1/2)^k * C(k,x)
否则
dp[i+1][j+x-(k-(n-j))] += dp[i][j] * (1/2)^k * C(k,x)

期望
期望= $\sum\limits_{}$ 概率x权值

Code

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e2+5;
const int mod=1e9+7;
#define ll long long
#define int ll
#define maxx(a,b) (a>b?a:b)
#define minx(a,b) (a<b?a:b)
#define pi 3.1415926
#define debug(...) fprintf(stderr, __VA_ARGS__)
inline ll qpow(ll base, ll n) { assert(n >= 0); ll res = 1; while (n) { if (n & 1) res = res * base % mod; base = base * base % mod; n >>= 1; } return res; }
ll gcd(ll a,ll b) {return b==0?a:gcd(b,a%b);}
ll lcm(ll a,ll b) { return a*b/gcd(a,b); }
ll inv(ll a) {return a == 1 ? 1 : (ll)(mod - mod / a) * inv(mod % a) % mod;}
ll C(ll n,ll m){if (m>n) return 0;ll ans = 1;for (int i = 1; i <= m; ++i) ans=ans*inv(i)%mod*(n-i+1)%mod;return ans%mod;}
ll A(ll n,ll m){ll sum=1; for(int i=n;i>=n-m+1;i--) sum=(sum*i)%mod; return sum%mod;}
ll GetSum(ll L, ll R) {return (R - L + 1ll) * (L + R) / 2ll;} //等差数列求和 
 
/************/
int t,n,m,k;
double c[maxn][maxn],p[maxn],dp[maxn][maxn],ans;
void init(){
	p[0]=1;
	for(int i=1;i<=100;i++) p[i]=p[i-1]*0.5;
	c[0][0]=1;
	for(int i=1;i<=100;i++){
		for(int j=0;j<=100;j++){
			c[i][j]=c[i-1][j]+c[i-1][j-1];
		}
	}
}
signed main()
{
	init();
	cin>>t;
	while(t--){
		ans=0;
		memset(dp,0,sizeof(dp));
		dp[0][0]=1;
		scanf("%lld%lld%lld",&n,&m,&k);
		for(int i=0;i<=m;i++){
			for(int j=0;j<=n;j++){
				for(int x=0;x<=k;x++){
					if(n-j>=k)
					dp[i+1][j+x]+=dp[i][j]*p[k]*c[k][x];
					else
					dp[i+1][j+x-(k-(n-j))]+=dp[i][j]*p[k]*c[k][x];
				}
			}
		}
		for(int i=0;i<=n;i++) ans+=dp[m][i]*i;
		printf("%.3lf\n",ans);
	}
	return  0;
}

WA自动鸡

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
ACM-ICPC 2017 Asia Urumqi A.Coins【概率dp / 期望dp】

Link概率dp/期望dp题意n个硬币初始朝下，掷m次，每次任意选k个投掷，问在采取最优策略下（使朝上硬币尽可能多），m次后朝上的硬币的数量的期望是多少？分析最优策略：尽可能的选朝下的硬币投掷令dp[i][j]表示为投i次后有j个硬币朝上的概率令x为第i次投掷完后，k个硬币中有x个朝上(0<=x<=k)考虑转移方程。由于采取最优策略，假设所取硬币全部朝下，则dp[i][j]对dp[i+1][j+x]有贡献。假设由于朝下硬币数量过少，无法取到k个，则需由朝上硬币代替
复制链接

扫一扫

专栏目录