传送门:HDU5781
题意:Alice忘记了自己银行里存了多少钱,只记得在[0,k]之间。每次取钱如果余额足够就出钱,否则警告一次,警告超过w次就会把你抓起来,在不被警察抓起来的前提下,Alice采取最优策略(尽量使取钱次数最少),求期望取钱多少次把钱全部取完。
官方题解:
dp转移方程就是上面那个方程,转移的时候有些逆推的思想,假设当前取要k,当前已知存款范围为[0, i],剩余警告次数为j,那么如果取款成功,状态就变成了已知存款范围为[0, i - k],剩余警告次数为j,若取款失败,那么状态就转移成了已知存款范围为[0, k - 1],剩余警告次数为j - 1,成功或者不成功的可能性都很容易算出来,最后再加上一次取款次数就行了。
还有就是应该取min而不是max。
代码:
#include<bits/stdc++.h>
#define ll long long
#define inf 0x3f3f3f3f
using namespace std;
typedef pair<int,int> P;
const int MAXN = 100010;
double dp[2010][12];
void init()
{
fill(dp[0], dp[0] + 2010 * 12, inf);
for(int i = 0; i < 12; i++)
dp[0][i] = 0;
for(int i = 1; i < 2001; i++)
for(int j = 1; j < 12; j++)
for(int k = 1; k <= i; k++)
dp[i][j] = min(dp[i][j], dp[i - k][j] * (i - k + 1) / (i + 1) + dp[k - 1][j - 1] * k / (i + 1) + 1);
}
int main()
{
int k, w;
init();
while(cin >> k >> w)
{
w = min(w, 11);
printf("%.6lf\n", dp[k][w]);
}
return 0;
}