【bzoj2318】Spoj4060 game with probability Problem 概率dp

最新推荐文章于 2018-04-29 16:45:14 发布

shiyongyang

最新推荐文章于 2018-04-29 16:45:14 发布

阅读量348

点赞数

分类专栏：概率期望动态规划

本文链接：https://blog.csdn.net/shiyongyang/article/details/78280218

版权

动态规划同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

概率期望

9 篇文章 0 订阅

订阅专栏

题目描述

Alice和Bob在玩一个游戏。有n个石子在这里，Alice和Bob轮流投掷硬币，如果正面朝上，则从n个石子中取出一个石子，否则不做任何事。取到最后一颗石子的人胜利。Alice在投掷硬币时有p的概率投掷出他想投的一面，同样，Bob有q的概率投掷出他相投的一面。

现在Alice先手投掷硬币，假设他们都想赢得游戏，问你Alice胜利的概率为多少。

输入

第一行一个正整数t，表示数据组数。

对于每组数据，一行三个数n，p，q。

输出

对于每组数据输出一行一个实数，表示Alice胜利的概率，保留6位小数。

样例输入

1
1 0.5 0.5

样例输出

0.666667

提示

数据范围：

1<=t<=50

0.5<=p,q<=0.99999999

对于100%的数据 1<=n<=99999999

题解：首先用dp【i】【o】表示还剩i个石子，A作为先手赢的概率，dp【i】【1】表示还剩个石子，A作为后手赢的概率，很显然：dp【0】【1】=1；

那就正推，如果dp【i-1】【1】>dp【i-1】【0】，那么A肯定是想抛出正面取走石子，反之肯定想抛出反面不取石子，因为初始化dp【0】【1】=1，所以还剩1个石子的时候A肯定是想抛到正面取走石子，所以p此时就代表抛到正面的概率，对于同一轮，要么两个人都想拿，要么两个人都想选，所以最后一轮，两个人都想当先手，以为推出来的公式中的p，q就是代表投想正面的概率面，不妨p，q都当成抛到正面的概率，对于后面到底是想抛正面还是反面，只需要将p或(1-p)，q或（1-q）带入公式计算即可。

fi 表示剩 i 个石头、 A 先手的获胜概率。
gi 表示剩 i 个石头、 A 后手的获胜概率。

如果想选，对于 fi ：
有 p 的概率进入 gi−1 ；有 1−p 的概率进入 gi
所以 fi=p∗gi−1+(1−p)∗gi

如果想选，对于 g(i) ：
有 q 的概率进入 fi−1 ；有 1−q 的概率进入 fi
所以 gi=q∗fi−1+(1−q)∗fi

整理得：

fi=p∗gi−1+(1−p)∗q∗fi−11−(1−p)∗(1−q)

gi=q∗fi−1+(1−q)∗p∗gi−11−(1−p)∗(1−q)

然后剩 i 个石头时A的想不想选的意愿与 fi−1、gi−1 的大小关系有关。
fi−1>gi−1 都不想选。
fi−1<gi−1 都想选。
然后对于不想选的情况，那么 p=1−p，q=1−q 就行了。

然而这样就没法用矩阵乘法了。。。
就需要黑科技，，当n很大时，其实概率已经基本不动了，，让n=min(n,1000)就好了Qwq。

总结：对于概率期望dp，一定把当前状态从上一个状态怎么转移过来（正推）、从当前状态转移到下一个状态怎么转移（逆推）要在数组中表示出来。

#include<algorithm>
#include<iostream>
#include<cstring>
#include<cstdio>
#include<cmath>
using namespace std;

int T,n;
double p,q,f[1005][2];

void clear()
{
    n=0;p=q=0;
    memset(f,0,sizeof(f));
}
int main()
{
    scanf("%d",&T);
    while (T--)
    {
        clear();
        scanf("%d%lf%lf",&n,&p,&q);
        n=min(n,1000);f[0][1]=1;
        for (int i=1;i<=n;++i)
            if (f[i-1][0]<f[i-1][1])
            {
                f[i][0]=(f[i-1][1]*p+f[i-1][0]*q*(1-p))/(1-(1-p)*(1-q));
                f[i][1]=(f[i-1][0]*q+f[i-1][1]*p*(1-q))/(1-(1-p)*(1-q));
            }
            else
            {
                f[i][0]=(f[i-1][1]*(1-p)+f[i-1][0]*(1-q)*p)/(1-p*q);
                f[i][1]=(f[i-1][0]*(1-q)+f[i-1][1]*(1-p)*q)/(1-p*q);
            }
        printf("%.6lf\n",f[n][0]);
    }
}

shiyongyang

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【bzoj2318】Spoj4060 game with probability Problem 概率dp

题目描述Alice和Bob在玩一个游戏。有n个石子在这里，Alice和Bob轮流投掷硬币，如果正面朝上，则从n个石子中取出一个石子，否则不做任何事。取到最后一颗石子的人胜利。Alice在投掷硬币时有p的概率投掷出他想投的一面，同样，Bob有q的概率投掷出他相投的一面。现在Alice先手投掷硬币，假设他们都想赢得游戏，问你Alice胜利的概率为多少。输入第一行一个正整
复制链接

扫一扫