http://poj.org/problem?id=2096
第一道概率期望dp,使用了全期望公式,入门题目。
/*
POJ 2096 期望DP
逆着递推求解
题意:(题意看题目确实比较难道,n和s都要找半天才能找到)
一个软件会产生n种bug,且分属于s个子系统
Ivan一天发现一个bug,这个bug属于某个子系统中
每个bug属于某个子系统的概率是1/s,属于某种分类的概率是1/n,很显然bug的种类与分属的系统相互独立
问发现n种bug,每个子系统都发现bug的天数的期望。
求解:
dp[i][j]表示已经找到i种bug,j个系统的bug,达到目标状态的天数的期望
dp[n][s]=0;要求的答案是dp[0][0];
dp[i][j]状态可以转化成以下四种:
dp[i][j] 发现一个bug属于已经找到的i种bug和j个子系统中 。概率为(i/n)*(j/s);
dp[i+1][j] 发现一个bug属于新的一种bug,但属于已经找到的j种子系统 .概率为 ((n-i)/n)*(j/s);
dp[i][j+1] 发现一个bug属于已经找到的i种bug,但属于新的子系统 .概率为 (i/n)*((s-j)/s);
dp[i+1][j+1]发现一个bug属于新的一种bug和新的一个子系统 .概率为(1-i/n)*(1-j/s);
把dp[i][j]合并一下整理便得到转移方程
*/
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cmath>
#include<cstring>
#include<vector>
#include<set>
#include<map>
#include<algorithm>
#include<sstream>
#define eps 1e-9
#define pi acos(-1)
#define long long ll
#define M 10
#define N 1010
using namespace std;
const int _max = 1e3 + 10;
int n,s;
double dp[_max][_max];
int main()
{
#ifndef ONLINE_JUDGE
freopen("input.txt","r",stdin);
#endif // ONLINE_JUDGE
while(scanf("%d%d",&n,&s)==2){
dp[n][s] = 0;
for(int i = n; i >= 0; -- i)
for(int j = s; j >= 0; -- j){
if(i==n&&j==s) continue;
dp[i][j] = ((n-i)*j*dp[i+1][j]+i*(s-j)*dp[i][j+1]+(n-i)*(s-j)*dp[i+1][j+1]+n*s)/(n*s-i*j);
}
printf("%.4f\n",dp[0][0]);
}
return 0;
}