传送门
题解:设dp[i][j]为存款范围在[0,i],还能被警告j次,取完钱所花次数的期望。
P.S.dp[k-1][j-1]中k-1的原因:去了k元发现超了,所以存款最多为k-1元
由于Alice会采取最优决策,所以按二分的思想取款最多次数为log2(2000)。
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
const int INF=0x3f3f3f3f;
double dp[2002][12];
int n,m;
int main() {
for (int i=0;i<2001;++i) dp[i][0]=INF;
for (int j=0;j<12;++j) dp[0][j]=0;
for (int i=1;i<=2000;++i)
for (int j=1;j<12;++j) {
dp[i][j]=INF;
for (int k=1;k<=i;++k)
dp[i][j]=min(dp[i][j],1.0*(i-k+1)/(i+1)*dp[i-k][j]+1.0*k/(i+1)*dp[k-1][j-1]+1);
}
while (~scanf("%d%d",&n,&m))
printf("%.6lf\n",dp[n][min(m,11)]);
return 0;
}