概率dp/期望dp
前置
知识点:帕斯卡恒等式(组合数学)
题意
n个硬币初始朝下,掷m次,每次任意选k个投掷,问在采取最优策略下(使朝上硬币尽可能多),m次后朝上的硬币的数量的期望是多少?
分析
-
最优策略:尽可能的选朝下的硬币投掷
-
令dp[i][j]表示为投i次后有j个硬币朝上的概率
令x为第i次投掷完后,k个硬币中有x个朝上(0<=x<=k) -
考虑转移方程。
由于采取最优策略,假设所取硬币全部朝下,则dp[i][j]对dp[i+1][j+x]有贡献。
假设由于朝下硬币数量过少,无法取到k个,则需由朝上硬币代替。所选朝下:n-j,所选朝上:k-(n-j),则硬币朝上增加或减少x-(k-(n-j))。此时dp[i][j]对dp[i+1][j+x-(k-(n-j))]有贡献。 -
得方程
- 若n-j>=k
dp[i+1][j+x] += dp[i][j] * (1/2)k * C(k,x) - 否则
dp[i+1][j+x-(k-(n-j))] += dp[i][j] * (1/2)k * C(k,x)
- 期望
期望= ∑ \sum\limits_{} ∑概率x权值
Code
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e2+5;
const int mod=1e9+7;
#define ll long long
#define int ll
#define maxx(a,b) (a>b?a:b)
#define minx(a,b) (a<b?a:b)
#define pi 3.1415926
#define debug(...) fprintf(stderr, __VA_ARGS__)
inline ll qpow(ll base, ll n) { assert(n >= 0); ll res = 1; while (n) { if (n & 1) res = res * base % mod; base = base * base % mod; n >>= 1; } return res; }
ll gcd(ll a,ll b) {return b==0?a:gcd(b,a%b);}
ll lcm(ll a,ll b) { return a*b/gcd(a,b); }
ll inv(ll a) {return a == 1 ? 1 : (ll)(mod - mod / a) * inv(mod % a) % mod;}
ll C(ll n,ll m){if (m>n) return 0;ll ans = 1;for (int i = 1; i <= m; ++i) ans=ans*inv(i)%mod*(n-i+1)%mod;return ans%mod;}
ll A(ll n,ll m){ll sum=1; for(int i=n;i>=n-m+1;i--) sum=(sum*i)%mod; return sum%mod;}
ll GetSum(ll L, ll R) {return (R - L + 1ll) * (L + R) / 2ll;} //等差数列求和
/************/
int t,n,m,k;
double c[maxn][maxn],p[maxn],dp[maxn][maxn],ans;
void init(){
p[0]=1;
for(int i=1;i<=100;i++) p[i]=p[i-1]*0.5;
c[0][0]=1;
for(int i=1;i<=100;i++){
for(int j=0;j<=100;j++){
c[i][j]=c[i-1][j]+c[i-1][j-1];
}
}
}
signed main()
{
init();
cin>>t;
while(t--){
ans=0;
memset(dp,0,sizeof(dp));
dp[0][0]=1;
scanf("%lld%lld%lld",&n,&m,&k);
for(int i=0;i<=m;i++){
for(int j=0;j<=n;j++){
for(int x=0;x<=k;x++){
if(n-j>=k)
dp[i+1][j+x]+=dp[i][j]*p[k]*c[k][x];
else
dp[i+1][j+x-(k-(n-j))]+=dp[i][j]*p[k]*c[k][x];
}
}
}
for(int i=0;i<=n;i++) ans+=dp[m][i]*i;
printf("%.3lf\n",ans);
}
return 0;
}