题意:给出n没硬币,最初硬币都是正面朝下,现在让你对这组硬币做k次操作,可以将一枚硬币翻为正面朝上或反面朝上,问你做完这k次操作,硬币所有策略和结果的组合中(combinations of strategies and results,组合,即所有的硬币不做区分)正面朝上的概率的期望值。
思路:动态规划。
设dp[i][j]表示第i次操作j面硬币朝上的概率。
dp[0][0]=1;这个初始化好理解,最初不做操作的时候所有硬币正面朝下;
接下来就是对硬币做操作。
当硬币数n>=k的时候最多只有k面硬币朝上的情况所以dp[i][j]=dp[i-1][j]*0.5+dp[i-1][j-1]*0.5;
第i次操作的时候要使j面硬币朝上,则可能是第i-1次操作下j面硬币朝上,在翻一枚硬币向下得来的结果或者是第i-1次操作j-1面硬币朝上在翻一枚硬币向上的来的结果,所以概率由两部分组成。
当k>n的时候,当有n面硬币向上时,在对其中一枚硬币进行操作的时候做多能再将一枚硬币翻回反面朝上,所以这时dp[i][n-1]=dp[i][n-1]+dp[i-1][n]*0.5;
在一种计算情况就是第i次操作0面硬币朝上的概率计算(会在动归过程影响1,2,3……面硬币朝上的结果):
dp[i][0]=dp[i-1][0]*0.5;只能是由第i-1次操作0面硬币朝上,在翻转一枚硬币使其反面仍然朝上的结果。
#include<bits/stdc++.h>
using namespace std;
int main()
{
int n,k;
cin>>n>>k;
double dp[405][405];
memset(dp,0,sizeof(dp));
dp[0][0]=1;
for(int i=1;i<=k;i++)
{
dp[i][0]=dp[i-1][0]/2.0;///第i次翻动,仍然是0面硬币朝上的情况。还有,这种必须放到循环内更新,否则在n=1,k>2的情况下放在循环外和循环内会有很大误差!!
for(int j=1;j<=n;j++)
{///每次增加一个正面硬币的时候都由i-1次操作中在增加一枚向上的硬币或者不增加
dp[i][j]=dp[i-1][j]/2.0+dp[i-1][j-1]/2.0;
}
dp[i][n-1]+=dp[i-1][n]/2.0;///因为每次翻动一枚硬币,所以当n<k的时候会有由n枚硬币都正面的情况再将一枚硬币翻回反面的一种情况
}
/* for(int i=0;i<=k;i++)
{
for(int j=0;j<=n;j++)
printf("dp[%d][%d]=%.2lf ",i,j,dp[i][j]);
printf("\n");
}*/
double sum=0;
for(int i=0;i<=n;i++)
sum+=dp[k][i]*(i*1.0);
printf("%.6lf\n",sum);
}