bzoj1419 Red is good 期望dp

最新推荐文章于 2019-03-01 09:33:23 发布

forever_shi

最新推荐文章于 2019-03-01 09:33:23 发布

阅读量169

点赞数

分类专栏： dp 概率期望

本文链接：https://blog.csdn.net/forever_shi/article/details/80680344

版权

dp 同时被 2 个专栏收录

65 篇文章 1 订阅

订阅专栏

概率期望

18 篇文章 0 订阅

订阅专栏

题意：有n张+1和m张-1的牌，可以中途停止摸牌，问按最优策略摸牌，最后期望得分。
由于有决策存在，那么就要满足有最优子结构，而我们可以通过计算期望来得知该状态的好坏，也就是知道在该状态下我们期望得更多分还是失去更多的分。那么有一个很显然的结论是，如果继续拿牌你期望得分是小于0的，那么你不如终止摸牌。
既然满足最优子结构了，那么我们就考虑dp。这个dp的状态是，我们设dp[i][j]为还剩i张+1，j张-1的期望得分，那么我们的转移方程是
$dp[i][j]=max(0,(dp[i-1][j]+1)*\frac{i}{i+j}+(dp[i][j-1]-1)*\frac{j}{i+1})$ 初始状态为 $d p [0] [j] = 0$ ， $d p [i] [0] = i$ 。
代码：

#include <bits/stdc++.h>
using namespace std;

int r,b;
double dp[5002][5002];
int main()
{
    scanf("%d%d",&r,&b);
    for(int i=1;i<=r;++i)
    dp[i][0]=i;
    for(int i=1;i<=b;++i)
    dp[0][i]=0;
    for(int i=1;i<=r;++i)
    {
        for(int j=1;j<=b;++j)
        {
            dp[i][j]=max(0.0,(dp[i-1][j]+1)*((double)i/(i+j))+(dp[i][j-1]-1)*((double)j/(i+j)));
        }
    }
    double ji=dp[r][b]*1e7;
    long long gg=ji;
    if(gg%1000000>=5)
    dp[r][b]-=5*1e-7;
    printf("%.6lf\n",dp[r][b]);
    return 0;
}