hdu 1204 糖果大战 (Markov Chains求期望)

糖果大战

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 2336    Accepted Submission(s): 797


Problem Description
生日Party结束的那天晚上,剩下了一些糖果,Gandon想把所有的都统统拿走,Speakless于是说:“可以是可以,不过我们来玩24点,你不是已经拿到了一些糖果了吗?这样,如果谁赢一局,就拿走对方一颗糖,直到拿完对方所有的糖为止。”如果谁能算出来而对方算不出来,谁就赢,但是如果双方都能算出或者都不能,就算平局,不会有任何糖果的得失。 
Speakless是个喜欢提前想问题的人,既然他发起了这场糖果大战,就自然很想赢啦(不然可就要精光了-_-)。现在他需要你的帮忙,给你他每局赢的概率和Gardon每局赢的概率,请你给出他可能获得这场大战胜利的概率。
 

Input
每行有四个数,Speakless手上的糖果数N、Gardon手上的糖果数M(0<=N,M<=50)、一局Speakless能解答出来的概率p、一个问题Gardon能解答出来的概率q(0<=p,q<=1)。
 

Output
每行一个数,表示Speakless能赢的概率(用百分比计算,保留到小数点后2位)。
 

Sample Input
  
  
50 50 0.5 0.5 10 10 0.51 0.5 50 50 0.51 0.5
 

Sample Output
  
  
0.50 0.60 0.88
 


用f[i]表示Speakless有i颗糖果的时赢的概率,则f[i]=p(1-q)*f[i+1]+q(1-p)*f[i-1]+(1-p*(1-q)-q*(1-p))*f[i];
这个方程表示当前状态赢的期望等于当前状态能到达的所有状态赢的期望的和。化简得,
(f[i+1]-f[i-1])*p*(1-q)=f[i]-f[i-1]*(q*(1-p));

令k= (q*(1-p) )/(p*(1-q));

设f[i+1]-f[i]= (f[i]-f[i-1])*k;

已知 f[0]=0; f[n+m]=1; (必输和必赢)

f[1]-f[0]=f[1];
f[2]-f[1]=(f[1])*k;
f[3]-f[2]=(f[2]-f[1])*k=f[1]*k^2;
...
f[n]-f[n-1]=(f[n-1]-f[n-1])*k=f[1]*k^(n-1);
对数列求和,得
f[n]=(1-k^n)/(1-k);
f[n+m]=(1-k^(n+m))/(1-k)=1;

则f[n]=f[n]/f[n+m]=(1-k^n)/(1-k^(n+m));


#include<stdio.h>
#include<math.h>
#include<string.h>
#include<stdlib.h>
#include<algorithm>
#include<queue>
using namespace std;
#define ll long long
#define N 25
const int M=256;
const double eps=1e-4;

int main()
{
    int n,m,n1,n2,i;
    double k,s,p,q;
    while(~scanf("%d%d%lf%lf",&n,&m,&p,&q))
    {
        if(m==0)
            s=1;
        else if(n==0||p==0||q==1)
            s=0;
        else
        {
            k=q*(1-p)/p/(1-q);
            if(fabs(k-1.0)<eps)  //此时用pow分母基本等于零,会出错
                s=n*1.0/(n+m);
            else
                s=(1.0-pow(k,n))/(1.0-pow(k,(n+m)));
        }
        printf("%.2f\n",s);
    }
    return 0;
}










评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值