ACM-ICPC 2017 Asia Urumqi A.Coins【概率dp / 期望dp】

Link

概率dp/期望dp

前置

知识点:帕斯卡恒等式(组合数学)
在这里插入图片描述

题意

n个硬币初始朝下,掷m次,每次任意选k个投掷,问在采取最优策略下(使朝上硬币尽可能多),m次后朝上的硬币的数量的期望是多少?

分析

  1. 最优策略:尽可能的选朝下的硬币投掷

  2. 令dp[i][j]表示为投i次后有j个硬币朝上的概率
    令x为第i次投掷完后,k个硬币中有x个朝上(0<=x<=k)

  3. 考虑转移方程。
    由于采取最优策略,假设所取硬币全部朝下,则dp[i][j]对dp[i+1][j+x]有贡献。
    假设由于朝下硬币数量过少,无法取到k个,则需由朝上硬币代替。所选朝下:n-j,所选朝上:k-(n-j),则硬币朝上增加或减少x-(k-(n-j))。此时dp[i][j]对dp[i+1][j+x-(k-(n-j))]有贡献。

  4. 得方程

  • 若n-j>=k
    dp[i+1][j+x] += dp[i][j] * (1/2)k * C(k,x)
  • 否则
    dp[i+1][j+x-(k-(n-j))] += dp[i][j] * (1/2)k * C(k,x)
  1. 期望
    期望= ∑ \sum\limits_{} 概率x权值

Code

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e2+5;
const int mod=1e9+7;
#define ll long long
#define int ll
#define maxx(a,b) (a>b?a:b)
#define minx(a,b) (a<b?a:b)
#define pi 3.1415926
#define debug(...) fprintf(stderr, __VA_ARGS__)
inline ll qpow(ll base, ll n) { assert(n >= 0); ll res = 1; while (n) { if (n & 1) res = res * base % mod; base = base * base % mod; n >>= 1; } return res; }
ll gcd(ll a,ll b) {return b==0?a:gcd(b,a%b);}
ll lcm(ll a,ll b) { return a*b/gcd(a,b); }
ll inv(ll a) {return a == 1 ? 1 : (ll)(mod - mod / a) * inv(mod % a) % mod;}
ll C(ll n,ll m){if (m>n) return 0;ll ans = 1;for (int i = 1; i <= m; ++i) ans=ans*inv(i)%mod*(n-i+1)%mod;return ans%mod;}
ll A(ll n,ll m){ll sum=1; for(int i=n;i>=n-m+1;i--) sum=(sum*i)%mod; return sum%mod;}
ll GetSum(ll L, ll R) {return (R - L + 1ll) * (L + R) / 2ll;} //等差数列求和 
 
/************/
int t,n,m,k;
double c[maxn][maxn],p[maxn],dp[maxn][maxn],ans;
void init(){
	p[0]=1;
	for(int i=1;i<=100;i++) p[i]=p[i-1]*0.5;
	c[0][0]=1;
	for(int i=1;i<=100;i++){
		for(int j=0;j<=100;j++){
			c[i][j]=c[i-1][j]+c[i-1][j-1];
		}
	}
}
signed main()
{
	init();
	cin>>t;
	while(t--){
		ans=0;
		memset(dp,0,sizeof(dp));
		dp[0][0]=1;
		scanf("%lld%lld%lld",&n,&m,&k);
		for(int i=0;i<=m;i++){
			for(int j=0;j<=n;j++){
				for(int x=0;x<=k;x++){
					if(n-j>=k)
					dp[i+1][j+x]+=dp[i][j]*p[k]*c[k][x];
					else
					dp[i+1][j+x-(k-(n-j))]+=dp[i][j]*p[k]*c[k][x];
				}
			}
		}
		for(int i=0;i<=n;i++) ans+=dp[m][i]*i;
		printf("%.3lf\n",ans);
	}
	return  0;
}
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值