【bzoj2318】Spoj4060 game with probability Problem 概率dp

题目描述

Alice和Bob在玩一个游戏。有n个石子在这里,Alice和Bob轮流投掷硬币,如果正面朝上,则从n个石子中取出一个石子,否则不做任何事。取到最后一颗石子的人胜利。Alice在投掷硬币时有p的概率投掷出他想投的一面,同样,Bob有q的概率投掷出他相投的一面。

现在Alice先手投掷硬币,假设他们都想赢得游戏,问你Alice胜利的概率为多少。

输入

第一行一个正整数t,表示数据组数。

对于每组数据,一行三个数n,p,q。

输出

对于每组数据输出一行一个实数,表示Alice胜利的概率,保留6位小数。 

样例输入

1
1 0.5 0.5

样例输出

0.666667

提示

数据范围:
1<=t<=50
0.5<=p,q<=0.99999999
对于100%的数据 1<=n<=99999999
题解:首先用dp【i】【o】表示还剩i个石子,A作为先手赢的概率,dp【i】【1】表示还剩个石子,A作为后手赢的概率,很显然:dp【0】【1】=1;
那就正推,如果dp【i-1】【1】>dp【i-1】【0】,那么A肯定是想抛出正面取走石子,反之肯定想抛出反面不取石子,因为初始化dp【0】【1】=1,所以还剩1个石子的时候A肯定是想抛到正面取走石子,所以p此时就代表抛到正面的概率,对于同一轮,要么两个人都想拿,要么两个人都想选,所以最后一轮,两个人都想当先手,以为推出来的公式中的p,q就是代表投想正面的概率面,不妨p,q都当成抛到正面的概率,对于后面到底是想抛正面还是反面,只需要将p或(1-p),q或(1-q)带入公式计算即可。

fi  表示剩  i  个石头、  A  先手的获胜概率。 
gi  表示剩  i  个石头、  A  后手的获胜概率。

如果想选,对于  fi : 
有  p  的概率进入  gi1  ;有  1p  的概率进入  gi  
所以  fi=pgi1+(1p)gi

如果想选,对于  g(i) : 
有  q  的概率进入  fi1  ;有  1q  的概率进入  fi  
所以  gi=qfi1+(1q)fi

整理得:

fi=pgi1+(1p)qfi11(1p)(1q)

gi=qfi1+(1q)pgi11(1p)(1q)

然后剩  i  个石头时A的想不想选的意愿与  fi1gi1  的大小关系有关。 
fi1>gi1  都不想选。 
fi1<gi1  都想选。 
然后对于不想选的情况,那么  p=1pq=1q  就行了。

然而这样就没法用矩阵乘法了。。。 
就需要黑科技,,当n很大时,其实概率已经基本不动了,,让n=min(n,1000)就好了Qwq。

总结:对于概率期望dp,一定把当前状态从上一个状态怎么转移过来(正推)、从当前状态转移到下一个状态怎么转移(逆推)要在数组中表示出来。

#include<algorithm>
#include<iostream>
#include<cstring>
#include<cstdio>
#include<cmath>
using namespace std;

int T,n;
double p,q,f[1005][2];

void clear()
{
    n=0;p=q=0;
    memset(f,0,sizeof(f));
}
int main()
{
    scanf("%d",&T);
    while (T--)
    {
        clear();
        scanf("%d%lf%lf",&n,&p,&q);
        n=min(n,1000);f[0][1]=1;
        for (int i=1;i<=n;++i)
            if (f[i-1][0]<f[i-1][1])
            {
                f[i][0]=(f[i-1][1]*p+f[i-1][0]*q*(1-p))/(1-(1-p)*(1-q));
                f[i][1]=(f[i-1][0]*q+f[i-1][1]*p*(1-q))/(1-(1-p)*(1-q));
            }
            else
            {
                f[i][0]=(f[i-1][1]*(1-p)+f[i-1][0]*(1-q)*p)/(1-p*q);
                f[i][1]=(f[i-1][0]*(1-q)+f[i-1][1]*(1-p)*q)/(1-p*q);
            }
        printf("%.6lf\n",f[n][0]);
    }
}


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值