hdu4089(概率DP)

题意:n个人排成一个队列,小明一开始排在第m个,可能出现四中情况:1、队列保持不变的概率p1; 2、第一个人排到最后一个的概率p2; 3、第一个人离开的概率p3;4、排队结束的概率p4.
求在排队结束时,小明排在前k个的概率。
思路:dp[i][j]表示一共i个人,小明排在第j个的排队结束的概率。状态转移:
j==1:    dp[i][1]=p1*dp[i][1]+p2*dp[i][i]+p4;
2<=j<=k: dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1]+p4;
k<j<=i:  dp[i][j]=p1*dp[i][j]+p2*dp[i][j-1]+p3*dp[i-1][j-1];
化简:
j==1:    dp[i][1]=p*dp[i][i]+p41;
2<=j<=k: dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1]+p41;
k<j<=i:  dp[i][j]=p*dp[i][j-1]+p31*dp[i-1][j-1];
其中:
p=p2/(1-p1);
p31=p3/(1-p1)
p41=p4/(1-p1)

可以循环i=1->n 递推求解dp[i].在求解dp[i]的时候dp[i-1]就相当于常数了。
在求解dp[i][1~i]时等到下列i个方程
j==1:   dp[i][1]=p*dp[i][i]+c[1];
2<=j<=k:dp[i][j]=p*dp[i][j-1]+c[j];
k<j=i:  dp[i][j]=p*dp[i][j]+c[j];
其中c[j]都是常数了。上述方程可以解出dp[i]了。
首先是迭代得到 dp[i][i].然后再代入就可以得到所有的dp[i]了。

代码如下:


#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <map>
#include <queue>
#include <vector>
#include <string>
#include <iostream>

#define N 2005
#define eps 10e-6
using namespace std;
double dp[N][N],c[N];
int main()
{
    int n,m,k;
    double p1,p2,p3,p4;
    while(scanf("%d%d%d%lf%lf%lf%lf",&n,&m,&k,&p1,&p2,&p3,&p4) != EOF)
    {
        if(p4 < eps)    {
            printf("0.00000\n");
            continue;
        }
        if(p1 == 1){
            if(m <= k)  printf("1.00000\n");
            else printf("0.00000\n");
            continue;
        }
        memset(dp,0,sizeof(dp));
        double p21 = p2/(1-p1);
        double p31 = p3/(1-p1);
        double p41 = p4/(1-p1);
        dp[1][1] = p41/(1-p21);
        int i,j;
        for(i = 2; i <= n; i++)
        {
            c[1] = p41;
            for(j = 2; j <= k; j++) c[j] = p41 + p31*dp[i-1][j-1];
            for(; j <= i; j++)   c[j] = p31*dp[i-1][j-1];
            double temp1 = p21,temp2 = c[1];
            for(j = 2; j <= i; j++){
                temp1 = p21*temp1;
                temp2 = c[j] + temp2*p21;
            }
            dp[i][i] = temp2/(1-temp1);
            dp[i][1] = c[1] + p21*dp[i][i];
            for(j = 2; j <= k; j++)
                dp[i][j] = p21*dp[i][j-1] + p31*dp[i-1][j-1] + p41;
            for(; j <= i; j++)  dp[i][j] = p21*dp[i][j-1] + p31*dp[i-1][j-1];
        }
        printf("%.5lf\n",dp[n][m]);
    }
    return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值