概率dp(抽牌)

最新推荐文章于 2022-09-26 17:17:48 发布

小学生一发的技术成长之旅

最新推荐文章于 2022-09-26 17:17:48 发布

阅读量270

点赞数

分类专栏：算法类文章标签：概率dp

本文链接：https://blog.csdn.net/weixin_39393640/article/details/88066426

版权

算法类专栏收录该内容

34 篇文章 0 订阅

订阅专栏

概率dp

这是dp的一类题。主要是概率和动态规划结合题目，话不多说，直接上题;
传送门:
https://www.nowcoder.com/practice/8b8c4fc44b614862b2a4f53771577995?tpId=90&tqId=30855&tPage=4&rp=4&ru=/ta/2018test&qru=/ta/2018test/question-ranking

解析

一看到这种题，显然直接求显然是不可能的，而且也很难讨论。所以这一类的题的解题思路一般是采用dp的求解形式。既然是要dp，你总得有状态转移方程吧。So，对于这种概率dp可以考虑每次操作的过程，我们只需要关注小明就行了，首先，小明每次要么拿最上面的数，要么拿最下面的数。假设只有一个数，那没什么好说的，小明直接拿走就game over了，有两个数时，小明能拿到的数期望为 $p\cdot a_i+(1-p)\cdot a_{i+1}$ 这个很容易就知道了。那么接下来就是重点了，因为是序列，所以我们可以假设 $d p [i] [j]$ 表示从第 $i$ 个数到第 $j$ 个数小明能拿的数的期望，那么这个转移怎么写了，这就需要参考前面两个数的过程了，当 $n > 2$ 时，即进行完上一过程后，后面的过程是紧接着前面的过程中。当小明拿完一次后，剩下的状态就为 $d p [i + 1] [j], d p [i] [j - 1]$ , 哪一个状态是和他的概率有关的，然后就是小方拿的了，显然小方和小明是没什么区别的，除了那个拿的概率不一样，小方每次拿之后又是另外两种状态，剩下的状态又是小明拿的解了，就可以直接当作答案了，所以概率的转移方程可以写成
$dp[i][j]=p\cdot (a_i+q\cdot dp[i+2][j]+(1-q)\cdot dp[i+1][j-1])+(1-p)\cdot (a_j+q\cdot dp[i+1][j-1]+(1-q)\cdot dp[i][j-2])$

AC代码

//  小学生一发的刷题之路
//
//  Mannacher Algorithm
//
//

#include <iostream>
#include <cstdio>
#include <string>
#include <cstring>
#include <algorithm>
#include <queue>
#include <deque>                //双向队列;
#include <cmath>
#include <set>
#include <stack>
#include <map>
#include <vector>
#include <cstdlib>
#include <iomanip>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef long double ld;
const double PI=acos(-1.0);
const double eps=1e-8;
const int maxn=1e3+5;
const int maxm=1e3+5;
const ll mod=1e9+7;
const int INF=1e8;
template<class T>
inline void read(T &ret){       //快速输入模版;
    ret=0;
    int f=1;
    char c=getchar();
    while(c<'0'||c>'9'){
        if(c=='-') f=-1;
        c=getchar();
    }
    while(c>='0'&&c<='9'){
        ret=ret*10+c-'0';
        c=getchar();
    }
    ret*=f;
}
template <class T>
inline void out(T ret){     //快速输出模版;
    if(ret>9)
    {
        out(ret/10);
    }
    putchar(ret%10+'0');
}
double a[maxn],dp[maxn][maxn];

int main()
{
    int n,P,Q;
    scanf("%d %d %d",&n,&P,&Q);
    double p=(double)P/100.0;
    double q=(double)Q/100.0;
    for(int i=1;i<=n;i++){
        scanf("%lf",&a[i]);
    }
    
    for(int i=1;i<=n;i++){      //区间长度为1时;
        dp[i][i]=a[i];
    }
    for(int i=1;i<n;i++){       //区间长度为2时;
        dp[i][i+1]=p*a[i]+(1-p)*a[i+1];
    }
    //dp[i][j]表示从[i,j]区间里小明能拿的数的期望;
    //dp[i][j]=p*(a[i]+q*dp[i+2][j]+(1-q)*dp[i+1][j-1]))
    //+(1-p)*(a[j]+q*dp[i][j-2]+(1-q)*dp[i+1][j-1]);        //即当前拿的地方以及剩下位置的情况;
    
    for(int len=2;len<n;len++){
        for(int i=1;i<=n-len;i++){
            int j=i+len;
            dp[i][j]=p*(a[i]+q*dp[i+2][j]+(1-q)*dp[i+1][j-1])+
            (1-p)*(a[j]+q*dp[i+1][j-1]+(1-q)*dp[i][j-2]);
        }
    }
    printf("%0.3lf\n",dp[1][n]);
    return 0;
}

新的开始，每天都要快乐哈!
在这里插入图片描述

小学生一发的技术成长之旅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
概率dp(抽牌)

概率dp这是dp的一类题。主要是概率和动态规划结合题目，话不多说，直接上题;传送门:https://www.nowcoder.com/practice/8b8c4fc44b614862b2a4f53771577995?tpId=90&amp;tqId=30855&amp;tPage=4&amp;rp=4&amp;ru=/ta/2018test&amp;qru=/ta/2018test/que...
复制链接

扫一扫

专栏目录