题目
T(T<=40)组样例,每次给出赛季长度n(n<=500),和获胜(W)的概率p(0<=p<=1)
求最大连续胜场的期望,即对最大连续胜场为i时的概率pi,求和i*pi
思路来源
https://blog.csdn.net/yeyeyeguoguo/article/details/43534917
题解
本来想的是dp[i][j][k]表示当前第i次,历史最大连续W为j,当前连续W为k的方案数,
O(n^3)怎么也降不下来,题解提供了一种新的dp思路
dp[i][j]表示的是第i次,连续赢的次数不超过j的所有情况的概率。
如此以来dp[i][j]=dp[i - 1][j],即填W/L均可
再减去不是该状态的情况的概率,即为多赢了一盘之后连续的情况超过j的情况,
该情况只在末尾有j个连续赢的情况出现,所以要扣掉dp[i][j] = dp[i - 1][j] - f[i - 1 - j - 1][j] * p
具体实现时,需要将末尾j个全是W的情形
和末尾j个W但从后往前数第j+1个是L,分开讨论
代码
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=505;
double P,p[N],dp[N][N];
//dp[i][j] 表示前i场 最大连续W 不超过j场的概率
int n;
int main(){
while(~scanf("%d%lf",&n,&P) && n){
p[0]=1;
for(int i=1;i<=n;++i){
p[i]=p[i-1]*P;
}
for(int i=0;i<=n;++i){
dp[0][i]=1;
}
for(int i=1;i<=n;++i){
for(int j=0;j<=n;++j){//循环到n 因为dp[i-1-(j+1)][j]可能j会超范围
dp[i][j]=dp[i-1][j];
if(j==i-1)dp[i][j]-=p[j+1];
else if(j<i-1)dp[i][j]-=dp[i-1-(j+1)][j]*(1.0-P)*p[j+1];
}
}
double ans=0;
for(int i=1;i<=n;++i){
ans+=i*(dp[n][i]-dp[n][i-1]);
}
printf("%.6lf\n",ans);
}
return 0;
}