HDOJ 4089 Activation (概率DP + 迭代)


点击打开链接



题意:

有n个人排队等着在官网上激活游戏,Tomato在第m个。每次激活的是队伍中的第一个人,有以下几种情况:

1、激活失败,留在队列中等待下一次激活,概率为p1

2、失去连接,出队列,然后排在队伍的最后,概率为p2

3、激活成功,离开队伍,概率为p3

4、服务器瘫痪,服务器停止激活,所有人都无法激活了。
求服务器瘫痪时Tomato在队列中的位置<=k的概率

解析:

此题n,m很大,不能用高斯消元来做,也没有必要。
概率DP;
设dp[i][j]表示i个人排队,Tomato排在第j个位置,达到目标状态的概率(j<=i)
dp[n][m]就是所求


j==1: dp[i][1]=p1*dp[i][1]+p2*dp[i][i]+p4;
2<=j<=k: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1]+p4;
k<j<=i: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1];


化简:
j==1: dp[i][1]=p*dp[i][i]+p41;
2<=j<=k: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1]+p41;
k<j<=i: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1];

其中:
p=p2/(1-p1);
p31=p3/(1-p1)
p41=p4/(1-p1)

在求解dp[i]的时候dp[i-1]就相当于常数了。
在求解dp[i][1~i]时等到下列i个方程
j==1: dp[i][1]=p*dp[i][i]+c[1];
2<=j<=k:dp[i][j]=p*dp[i][j-1]+c[j];
k<j=i: dp[i][j]=p*dp[i][j-1]+c[j];
其中c[j]都是常数了,对于不同范围的j,c[j]的表达式不同。上述方程可以解出dp[i]了。
首先是迭代得到 dp[i][i].然后再回代入就可以得到所有的dp[i]了。
迭代就是比如,dp[i][2] = p*dp[i][1]+c[2] = p*(p*dp[i][i]+c[1])+c[1]; dp[i][3]同理,这样下去,dp[i][i]也会变成一个关于dp[i][i]的式子。
注意特判一种情况。就是p4<eps时候,就不会崩溃了,应该直接输出0。





#include<cstdio>
#include<cstring>
#include<string>
#include<iostream>
#include<cmath>
#include<algorithm>
#define eps 1e-8
const int N = 2005;
int n, m, k;
double p1, p2, p3, p4, p, s, p31, p41, sum;
double pc[N], c[N], dp[N][N];
int main()
{
    while (~scanf("%d%d%d%lf%lf%lf%lf", &n, &m, &k, &p1, &p2, &p3, &p4))
    {
        if(p4 < eps)
        {
            printf("0.00000\n");
            continue;
        }
        p = p2 / (1 - p1);
        p31 = p3 / (1 - p1);
        p41 = p4 / (1 - p1);
        s = 1;
        pc[0] = 1;
        for (int i = 1; i <= n; i++)
        {
            s *= p;
            pc[i] = s;
        }
        for (int i = 1; i <= n; i++)
        {
            for (int j = 1; j <= i; j++)
            {
                if (j == 1) c[j] = p41;
                if (j >= 2 && j <= k) c[j] = p31 * dp[i-1][j-1] + p41;
                if (j > k && j <= i) c[j] = p31 * dp[i-1][j-1];
            }
            sum = 0;
            for (int l = 0; l < i; l++)
            {
                sum += pc[l] * c[i-l];
            }
            dp[i][i] = sum / (1 - pc[i]);
            for (int j = 1; j <= i; j++)
            {
                if (j == 1) dp[i][j] = p*dp[i][i] + c[1];
                if (j >= 2 && j <= k) dp[i][j] = p * dp[i][j-1] + c[j];
                if (j > k && j <= i) dp[i][j] = p * dp[i][j-1] + c[j];
            }
        }
        printf("%.5f\n", dp[n][m]);
    }
    return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值