【GYM 101606F】Flipping Coins (全概率公式 + 概率dp)

题目大意:有n枚面朝下的硬币,问抛m次之后,最大的朝上的硬币数期望是多少?

分析:为什么问的是最大的朝上个数呢?因为是要抛m次,而算的是你最后面朝上的硬币的个数。想想看,想要最后面朝上的硬币最多,每次都选面朝下的硬币来抛,问题就在于可能出现抛了不到m次就全朝上的情况,这个时候只能选一枚面朝上的硬币来抛。

解法:看到期望就以为是期望dp了嘛?试了一下然后发现期望dp状态都列不出来。实际上这题是一个概率dp,概率dp和期望dp是相似的,用全概率公式转移,只要计算子问题的概率就行。最后期望就直接套期望公式。

转移方程:设dp[i][j]表示抛i次j个向上的概率,根据全概率公式:dp[i][j] = dp[i - 1][j] * 0.5 + dp[i - 1][j - 1] * 0.5,特别的,当j == (n - 1) 时,有dp[i][j] = dp[i - 1][j] * 0.5 + dp[i - 1][j + 1] * 0.5 + dp[i - 1][j - 1] * 0.5。
原因在于j == n - 1这个状态也可能是由已经全部朝上的硬币转移得到,可能抛了一枚已经面朝上的硬币而结果是那枚硬币面朝下了。

#include<bits/stdc++.h>
using namespace std;
const int maxn = 5e2 + 10;
double dp[maxn][maxn];
int main() {
	int n,m;
	scanf("%d%d",&n,&m);
	dp[0][0] = 1;
	for(int i = 1; i <= m; i++) {
		for(int j = 0; j <= n; j++) {
			dp[i][j] += dp[i - 1][j] * 0.5;
			dp[i][j] += dp[i - 1][j - 1] * 0.5;
			if(j == n - 1) dp[i][j] += dp[i - 1][n] * 0.5;
		} 
	}
	double ans = 0;
	for(int i = 0; i <= n; i++)
		ans += dp[m][i] * i;
	printf("%.6lf\n",ans);
	return 0;
}
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyCharm是一个集成开发环境(IDE),用于Python编程语言的开发。它提供了许多功能,例如代码编辑、调试和版本控制等。Gym是一个用于开发和比较强化学习算法的开源Python库。它提供了许多预定义的环境,供开发者进行强化学习实验。在安装深度强化学习环境的教程中,引用提到了在Windows 10上安装Anaconda、PyTorch、PyCharm和Gym等软件和包。引用提到了需要下载的软件和包,包括Anaconda、Pycharm、Python、PyTorch、Gym以及Pygame等。而引用中提到了通过pip命令来安装Gym库。综上所述,PyCharm和Gym都是用于Python开发和深度强化学习的工具和库。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [DRL环境安装:Win10+Anaconda+PyTorch+PyCharm+Gym](https://blog.csdn.net/weixin_42480812/article/details/112054592)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Anaconda+PyCharm+PyTorch+Gym深度强化学习环境搭建 送新手直接送进炼丹炉](https://blog.csdn.net/qq_43674552/article/details/127343863)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值