概率dp(抽牌)

概率dp

这是dp的一类题。主要是概率和动态规划结合题目,话不多说,直接上题;
传送门:
https://www.nowcoder.com/practice/8b8c4fc44b614862b2a4f53771577995?tpId=90&tqId=30855&tPage=4&rp=4&ru=/ta/2018test&qru=/ta/2018test/question-ranking

解析

一看到这种题,显然直接求显然是不可能的,而且也很难讨论。所以这一类的题的解题思路一般是采用dp的求解形式。 既然是要dp,你总得有状态转移方程吧。So,对于这种概率dp可以考虑每次操作的过程,我们只需要关注小明就行了,首先,小明每次要么拿最上面的数,要么拿最下面的数。假设只有一个数,那没什么好说的,小明直接拿走就game over了,有两个数时,小明能拿到的数期望为 p ⋅ a i + ( 1 − p ) ⋅ a i + 1 p\cdot a_i+(1-p)\cdot a_{i+1} pai+(1p)ai+1 这个很容易就知道了。那么接下来就是重点了,因为是序列,所以我们可以假设 d p [ i ] [ j ] dp[i][j] dp[i][j]表示从第 i i i个数到第 j j j个数小明能拿的数的期望,那么这个转移怎么写了,这就需要参考前面两个数的过程了,当 n > 2 n>2 n>2时,即进行完上一过程后,后面的过程是紧接着前面的过程中。当小明拿完一次后,剩下的状态就为 d p [ i + 1 ] [ j ] , d p [ i ] [ j − 1 ] dp[i+1][j],dp[i][j-1] dp[i+1][j],dp[i][j1], 哪一个状态是和他的概率有关的,然后就是小方拿的了,显然小方和小明是没什么区别的,除了那个拿的概率不一样,小方每次拿之后又是另外两种状态,剩下的状态又是小明拿的解了,就可以直接当作答案了,所以概率的转移方程可以写成
d p [ i ] [ j ] = p ⋅ ( a i + q ⋅ d p [ i + 2 ] [ j ] + ( 1 − q ) ⋅ d p [ i + 1 ] [ j − 1 ] ) + ( 1 − p ) ⋅ ( a j + q ⋅ d p [ i + 1 ] [ j − 1 ] + ( 1 − q ) ⋅ d p [ i ] [ j − 2 ] ) dp[i][j]=p\cdot (a_i+q\cdot dp[i+2][j]+(1-q)\cdot dp[i+1][j-1])+(1-p)\cdot (a_j+q\cdot dp[i+1][j-1]+(1-q)\cdot dp[i][j-2]) dp[i][j]=p(ai+qdp[i+2][j]+(1q)dp[i+1][j1])+(1p)(aj+qdp[i+1][j1]+(1q)dp[i][j2])

AC代码
//  小学生一发的刷题之路
//
//  Mannacher Algorithm
//
//

#include <iostream>
#include <cstdio>
#include <string>
#include <cstring>
#include <algorithm>
#include <queue>
#include <deque>                //双向队列;
#include <cmath>
#include <set>
#include <stack>
#include <map>
#include <vector>
#include <cstdlib>
#include <iomanip>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef long double ld;
const double PI=acos(-1.0);
const double eps=1e-8;
const int maxn=1e3+5;
const int maxm=1e3+5;
const ll mod=1e9+7;
const int INF=1e8;
template<class T>
inline void read(T &ret){       //快速输入模版;
    ret=0;
    int f=1;
    char c=getchar();
    while(c<'0'||c>'9'){
        if(c=='-') f=-1;
        c=getchar();
    }
    while(c>='0'&&c<='9'){
        ret=ret*10+c-'0';
        c=getchar();
    }
    ret*=f;
}
template <class T>
inline void out(T ret){     //快速输出模版;
    if(ret>9)
    {
        out(ret/10);
    }
    putchar(ret%10+'0');
}
double a[maxn],dp[maxn][maxn];

int main()
{
    int n,P,Q;
    scanf("%d %d %d",&n,&P,&Q);
    double p=(double)P/100.0;
    double q=(double)Q/100.0;
    for(int i=1;i<=n;i++){
        scanf("%lf",&a[i]);
    }
    
    for(int i=1;i<=n;i++){      //区间长度为1时;
        dp[i][i]=a[i];
    }
    for(int i=1;i<n;i++){       //区间长度为2时;
        dp[i][i+1]=p*a[i]+(1-p)*a[i+1];
    }
    //dp[i][j]表示从[i,j]区间里小明能拿的数的期望;
    //dp[i][j]=p*(a[i]+q*dp[i+2][j]+(1-q)*dp[i+1][j-1]))
    //+(1-p)*(a[j]+q*dp[i][j-2]+(1-q)*dp[i+1][j-1]);        //即当前拿的地方以及剩下位置的情况;
    
    for(int len=2;len<n;len++){
        for(int i=1;i<=n-len;i++){
            int j=i+len;
            dp[i][j]=p*(a[i]+q*dp[i+2][j]+(1-q)*dp[i+1][j-1])+
            (1-p)*(a[j]+q*dp[i+1][j-1]+(1-q)*dp[i][j-2]);
        }
    }
    printf("%0.3lf\n",dp[1][n]);
    return 0;
}

新的开始,每天都要快乐哈!
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值