POJ 2096 概率DP

题意:
   一个软件有s个子系统,n种bug,一个人每天可以发现一个bug

   求发现n种bug且每个子系统至少有一个bug的期望(也就是平均天数)

分析:

这是我的第一道概率DP问题,看了网上题解后才会做,这里使用逆着递推
        我感觉顺着递推应该也能做,但是没有尝试。
         dp[i][j]表示已经找到i种bug,j个系统的bug,达到目标状态的天数的期望
         dp[n][s]=0;要求的答案是dp[0][0];
         dp[i][j]可以转化成以下四种状态:
              dp[i][j],发现一个bug属于已经有的i个分类和j个系统。
              概率为p1 = (i/n)*(j/s);
              dp[i][j+1],发现一个bug属于已有的分类,不属于已有的系统.
              概率为 p2 = (i/n)*(1-j/s);
              dp[i+1][j],发现一个bug不属于已有的分类,属于已有的系统,
              概率为 p3 = (1-i/n)*(j/s);
              dp[i+1][j+1],发现一个bug不属于已有的系统,不属于已有的分类,
              概率为 p4 = (1-i/n)*(1-j/s);
        整理便得到转移方程dp[i][j] = p1*dp[i][j]+p2*dp[i][j+1]+p3*dp[i+1][j]+p4*dp[i+1][j+1] + 1;
        为什么要这样写,我看了网上写的题解想了好久...
        首先由于期望具有线性,两个不想关的随机变量可以相加即
            E(aA+bB+cC+...) = aEA+bEB+cEC+...  a,b,c,d...表示概率,A,B,C...表示状态
        所以本题开始我一直不理解为什么是dp[i][j]推出另外四种状态但是却是另外四种乘上概率
        然后我又不理解为什么后边会加上1,我找到的题解中都没有说为什么要加
        我自己得理解是经过了一天状态才能从dp[i][j]到另外四种状态,所以逆推过来,
        dp[i][j]要比另外四种状态理论上多一天。

最后就是注意G++最后输出要用%.4f,因为这个WA了好多发,第一次被这样坑。。

#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <iostream>
using namespace std;

const int maxn = 1000 + 5;
double f[maxn][maxn];


int main()
{
    int n, s;
    while(cin >> n >> s)
    {
        memset(f, 0, sizeof(f));
        f[n][s] = 0.0;
        for (int i = n; i >= 0; i--)
        {
            for (int j = s; j >= 0; j--)
            {
                double p1 = (n-i)*j*1.0;
                double p2 = i*(s-j)*1.0;
                double p3 = (n-i)*(s-j)*1.0;
                double p4 = n*s - i*j*1.0;
                if (i == n && j == s)continue;
                f[i][j] = 1.0*(p1*f[i+1][j]+p2*f[i][j+1]+p3*f[i+1][j+1]+n*s)/p4;
            }
        }
        printf("%.4lf\n", f[0][0]);//注意poj上G++要用%.4f
    }
    return 0;
}





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值