概率DP入门小结

说是概率DP,其实主要是求概率和期望的问题

说到DP总要有状态,每种状态可能有多种子状态

一般的DP是这样:在DP过程中,当前状态必然是由多个子状态中的最优的转移而来

所以一般的DP求的是最优的结果

而概率不需要最优,而是实际概率

所以概率DP最大的区别在于:在DP过程中,当前状态是由所有子状态的概率共同转移而来

所以概率DP只是利用了DP的动态而没有规划 (只有状态转移,而不需要进行决策)

至于状态转移方程怎么列,最科学的自然是根据数学知识列,

不过实际做题中会发现找规律也是一种不错的方法,

而事实证明,如果可以状态转移,找规律的方法往往是可行的

不过数学扎实的话用数学知识绝对要比找规律快且准

POJ 3744 (矩阵优化)

题意:一条路上有n个地雷,你站在起点1的位置,每次有p的概率走1步,有1-p的概率走2步,
给出n,p,和n个雷的坐标xi,问不踩到地雷的概率
数据范围 : 1 <= n <= 10  ,0.25 <= p <= 0.75 ,1 <= xi <= 10^8
分析:
显然有雷的点比没有雷的点多得多,所以计算踩到雷的概率要比计算不踩到雷的概率简单
将路分为n段,(1~x1,x1~x2,x2~x3,...,xn-1~xn)单独计算每段踩到雷的概率,
利用乘法原理求出踩到雷的总概率,不踩到雷的概率 = 1 - 踩到雷的概率
dp[i]表示到达i点的概率
dp[i] = p*dp[i-1]+(1-p)*dp[i-2]
坐标数据太大,直接乘肯定不行,这个时候就需要用到矩阵快速幂
上面dp的状态转移方程其实和斐波那契数列的表达式很像不是吗^_^
用一样的原理构造矩阵就好了

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
typedef long long ll;
struct Matrix
{
	double mat[2][2];
};
Matrix operator * (Matrix a,Matrix b)
{
	Matrix c;
	for (int i = 0;i < 2;++i)
	{
		for (int j = 0;j < 2;++j)
		{
			c.mat[i][j] = 0;
			for (int k = 0;k < 2;++k)
			{
				c.mat[i][j] += a.mat[i][k]*b.mat[k][j];
			}
		}
	}
	return c;
}
Matrix operator ^ (Matrix a,ll k)//矩阵幂 
{
	Matrix c;
	memset(c.mat,0,sizeof(c.mat));
    for(int i=0;i<2;i++)c.mat[i][i]=1;//初始化为单位矩阵 
    //据说任何矩阵乘以单位矩阵其值不会变
    for (;k;k>>=1)
    {
        if (k&1) c = c*a;
        a = a*a;
    }
    return c; 
}
int x[111]; 
int main()
{
	int n;double p;
	while (cin>>n>>p)
	{
		for (int i = 0;i < n;++i) scanf("%d",x+i);
		sort(x,x+n);
		double ans = 1.0;
		Matrix c;
		c.mat[0][0] = p,c.mat[0][1] = 1.0-p;
		c.mat[1][0] = 1.0,c.mat[1][1] = 0.0;
		Matrix a = c^(x[0]-1);
		ans *= (1-a.mat[0][0]);
		for (int i = 1;i < n;++i)
		{
			if (x[i] == x[i-1]) continue;
			a = c^(x[i]-x[i-1]-1);
			ans *= (1.0-a.mat[0][0]);
		}
		printf("%.7f\n",ans);
	}
	return 0;
}

POJ 3071

全概率问题:

当前场次要与j比赛的队伍x是哪个?而x能与j比必然是胜过了对手

        dp[i][j]表示第i次比赛j赢的概率

        dp[i][j] += dp[i-1][j]*dp[i-1][t]*p[j][t]

其中t是第i次比赛可能与j相邻的队伍
第奇数个赢家和前一个赢家比赛
第偶数个赢家和后一个赢家比赛 

#define mem(a,x) memset(a,x,sizeof(a))
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<queue>
#include<set>
#include<stack>
#include<cmath>
#include<map>
#include<stdlib.h>
#include<cctype>
#include<string>
#define Sint(n) scanf("%d",&n)
#define Sll(n) scanf("%I64d",&n)
#define SDB(n) scanf("%lf",&n)
#define Schar(n) scanf("%c",&n)
#define Schars(s) scanf("%s",s) 
#define Sint2(x,y) scanf("%d %d",&x,&y)
#define Sll2(x,y) scanf("%I64d %I64d",&x,&y)
#define Pint(x) printf("%d",x)
#define Pllc(x,c) printf("%I64d%c",x,c)
#define Pintc(x,c) printf("%d%c",x,c)
using namespace std;
typedef long long ll;
const int inf = 0x3f3f3f3f;
const int N = 8;
double dp[N][1<<N];//dp[i][j]表示第i次比赛j赢的概率
/*
	dp[i][j] += dp[i-1][j]*dp[i-1][t]*p[j][t]
	其中t是第i次比赛可能与j相邻的队伍
	第奇数个赢家和前一个赢家比赛
	第偶数个赢家和后一个赢家比赛 
*/ 
int n;double p[1<<N][1<<N];
int main()
{
    while (Sint(n),~n)
    {
    	for (int i = 0;i < (1<<n);++i)
    	{
    		for (int j = 0;j < (1<<n);++j)
    		{
    			SDB(p[i][j]);
			}
		}
		mem(dp,0);
		for (int i = 0;i < (1<<n);++i) dp[0][i] = 1;
		for (int i = 1;i <= n;++i)//进行n场比赛
		{
			for (int j = 0;j < (1<<n);++j)
			{
				int t = j>>(i-1);//j是第t个胜者
				if (t&1)//奇数与j-1比 
				{
					for (int k = t*(1<<(i-1))-1;k >= (t-1)*(1<<(i-1));--k)
					{
						dp[i][j] += dp[i-1][j]*dp[i-1][k]*p[j][k];
					}
				} 
				else //偶数与j+1比 
				{
					for (int k = (t+1)*(1<<(i-1));k < (t+2)*(1<<(i-1));++k)
					{
						dp[i][j] += dp[i-1][j]*dp[i-1][k]*p[j][k];
					} 
				}
			}
		} 
		int mx = 0;
		for (int i = 0;i < (1<<n);++i)
		{
			if (dp[n][i]>dp[n][mx]) mx = i;
		}
		Pintc(mx+1,'\n');
	}
    return 0;
}

CodeForces 148D

Pear和Fish玩游戏游戏:
一个袋子里一开始装着w个白球和b个黑球。

从Pear开始,每次轮流随机抽出一个球。如果抽出的球是白色的,则抽出这个球的人立即获胜。

每当一个球被取出后(然后结算获胜情况后),会有另一个球自动滚出来(不算任何人抽的)。

每个人抽球、和自动滚出来的球都是等概率的。那么Pear获胜率是多少呢?

(以上为原题意抽象成的简单摸球概率问题)

dp[i][j]表示Peal摸球时剩余i个白球和j个黑球的胜率

#define mem(a,x) memset(a,x,sizeof(a))
#define EX2(x) ((x)*(x))
#define EX3(x) ((x)*(x)*(x))
#pragma comment(linker, "/STACK:1024000000,1024000000")
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<queue>
#include<set>
#include<stack>
#include<cmath>
#include<map>
#include<stdlib.h>
#include<cctype>
#include<string>
#define Sint(n) scanf("%d",&n)
#define Sll(n) scanf("%I64d",&n)
#define SDB(n) s
  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
期望dp概率dp是两种不同的动态规划方法。 期望dp是指通过计算每个状态的期望值来求解最终的期望。在期望dp中,我们通常定义dp\[i\]表示在第i个状态时的期望值,然后通过状态转移方程来更新dp数组,最终得到最终状态的期望值。期望dp通常用于求解期望问题,例如求解骰子的期望点数、求解抽奖的期望次数等。 概率dp是指通过计算每个状态的概率来求解最终的概率。在概率dp中,我们通常定义dp\[i\]表示在第i个状态时的概率,然后通过状态转移方程来更新dp数组,最终得到最终状态的概率概率dp通常用于求解概率问题,例如求解抛硬币出现正面的概率、求解从一副牌中抽到红心的概率等。 总结来说,期望dp概率dp的区别在于它们所计算的是不同的值,期望dp计算的是期望值,而概率dp计算的是概率值。 #### 引用[.reference_title] - *1* [概率/期望dp专题](https://blog.csdn.net/qq_34416123/article/details/126585094)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [【动态规划】数学期望/概率DP/期望DP详解](https://blog.csdn.net/weixin_45697774/article/details/104274160)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值