【JZOJ6296】投票【期望概率】【dp】

题目大意:

题目链接:https://jzoj.net/senior/#main/show/6296
i i i个人有 p i p_i pi的概率会选择1,否则选择0。求在 n n n个人中选择 m m m个,1和0的个数相等的期望。


思路:

30 p t s 30pts 30pts

O ( 3 n ) O(3^n) O(3n)暴力搜索每一个人是不选,选1还是选0。用状压记录每一种选择方案的概率。
空间复杂度 O ( 2 n ) O(2^n) O(2n)
好像 O ( 4 n ) O(4^n) O(4n)还可以拿 40 p t s 40pts 40pts
代码 L i n k Link Link


100 p t s 100pts 100pts

p i p_i pi排序,如果此时最有方案中存在一个选择的人,他左右均有人且都没有被选择,那么固定其他选择的人,在剩余的人中选择,期望一定为一个一次函数。所以这个人肯定王左或往右会更优。
所以设 f [ i ] [ j ] f[i][j] f[i][j]表示在 [ 1 , i ] [1,i] [1,i]中选择 j j j个人选择1, g [ i ] [ j ] g[i][j] g[i][j]表示在 [ i , n ] [i,n] [i,n]中选择 j j j个人选择1。
f f f为例,如果这一个位置选择0,那么 f [ i ] [ j ] = f [ i − 1 ] [ j − 1 ] × ( 1 − p [ i ] ) f[i][j]=f[i-1][j-1]\times (1-p[i]) f[i][j]=f[i1][j1]×(1p[i]),如果这一个位置选择1,那么 f [ i ] [ j ] = f [ i − 1 ] [ j − 1 ] × p [ i ] f[i][j]=f[i-1][j-1]\times p[i] f[i][j]=f[i1][j1]×p[i]
所以方程就是
f [ i ] [ j ] = f [ i − 1 ] [ j ] × ( 1 − p [ i ] ) + f [ i − 1 ] [ j − 1 ] × p [ i ] f[i][j]=f[i-1][j]\times (1-p[i])+f[i-1][j-1]\times p[i] f[i][j]=f[i1][j]×(1p[i])+f[i1][j1]×p[i]
最后枚举前面选多少人,以及前面几个人选1,计算一下答案即可。
时间复杂度 O ( n m ) O(nm) O(nm)


代码:

#include <cstdio>
#include <algorithm>
using namespace std;

const int N=2010;
double p[N],f[N][N],g[N][N],ans,maxn;
int n,m;

int main()
{
	freopen("vote.in","r",stdin);
	freopen("vote.out","w",stdout);
	scanf("%d%d",&n,&m);
	for (int i=1;i<=n;i++)
		scanf("%lf",&p[i]);
	sort(p+1,p+1+n);
	f[0][0]=g[n+1][0]=1.0;
	for (int i=1;i<=n;i++)
		for (int j=0;j<=m;j++)
		{
			if (!j) f[i][j]=f[i-1][j]*(1-p[i]);
			f[i][j]=f[i-1][j]*(1-p[i])+f[i-1][j-1]*p[i];
		}
	for (int i=n;i>=1;i--)
		for (int j=0;j<=m;j++)
		{
			if (!j) g[i][j]=g[i+1][j]*(1-p[i]);
			g[i][j]=g[i+1][j]*(1-p[i])+g[i+1][j-1]*p[i];
		}
	for (int i=0;i<=m;i++)
	{
		ans=0.0;
		for (int j=0;j<=m/2;j++)
			ans+=f[i][j]*g[n-m+i+1][m/2-j];
		if (ans>maxn) maxn=ans;
	}
	printf("%0.8lf",maxn);
	return 0;
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
期望dp概率dp是两种不同的动态规划方法。 期望dp是指通过计算每个状态的期望值来求解最终的期望。在期望dp中,我们通常定义dp\[i\]表示在第i个状态时的期望值,然后通过状态转移方程来更新dp数组,最终得到最终状态的期望值。期望dp通常用于求解期望问题,例如求解骰子的期望点数、求解抽奖的期望次数等。 概率dp是指通过计算每个状态的概率来求解最终的概率。在概率dp中,我们通常定义dp\[i\]表示在第i个状态时的概率,然后通过状态转移方程来更新dp数组,最终得到最终状态的概率概率dp通常用于求解概率问题,例如求解抛硬币出现正面的概率、求解从一副牌中抽到红心的概率等。 总结来说,期望dp概率dp的区别在于它们所计算的是不同的值,期望dp计算的是期望值,而概率dp计算的是概率值。 #### 引用[.reference_title] - *1* [概率/期望dp专题](https://blog.csdn.net/qq_34416123/article/details/126585094)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [【动态规划】数学期望/概率DP/期望DP详解](https://blog.csdn.net/weixin_45697774/article/details/104274160)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值