HDU5781 ATM Mechine
题目大意:某个未知整数x等概率的分布在[0,k]中。每次你都可以从这个整数中减去一个任意整数y,如果x>=y,那么x=x-y,操作次数累计加1;否则,将会受到一次错误提示。当错误提示超过w次,将会对你的人生产生影响。现在,你的任务是将x逐步变为0,求最少操作次数的期望值。
思路:
概率DP求期望。定义状态dp(k,w)表示已知整数分布在[0,k],错误提示次数上限为w时的最少操作次数的期望次数。
则dp(k,w)=min(p1 * dp(k-y, w)+p2 * (y-1, w-1))+1,其中p1、p2分别为k >= y、k < y的概率,p1=(k-y+1)/(k+1)、p2=y/(k+1),我们有0~k共k+1种取钱的情况(因为我们知道最多k元,所以y < k+1),其中又有y种情况k=0~y-1共y种情况被警告(1-后者就是前者了)。有p1的概率,我们成功地取出来y,那么我们自然就知道了,卡上还剩k-y。如果我们被警告了,那么我们就知道卡上最多有y-1。因为比前一状态多操作了一次,所以要+1。
考虑最优的情况,我们要尽量少的被警告,所以每次都会二分的选择要减掉的整数y。根据题目的数据规模,你最多会操作log2(k)+1次,所以你被错误提示的次数最多log2(k)次(约为11~12)。于是状态数目就减少了,使得上述方程能够得以实现。
初始化i = 0时为0, j=0时为无穷大。
#include <cstdio>
#include <iostream>
using namespace std;
const int INF = 0x3f3f3f3f;//inf要开大一点
const int N = 2010;
double dp[N][25];
int main(){
int k, w;
for(int i=1; i<N; i++)
dp[i][0] = INF;
for(int i=0; i<20; i++)
dp[0][i] = 0;
for(int i=1; i<N; i++)
for(int j=1; j<20; j++){
dp[i][j] = INF;
for(int k=1; k<=i; k++)
dp[i][j] = min(dp[i][j], (i-k+1.0)/(i+1)*dp[i-k][j]+k/(i+1.0)*dp[k-1][j-1]+1);//1.0
}
while(~scanf("%d%d", &k, &w))
printf("%.6f\n", dp[k][min(w, 15)]);
return 0;
}