题目大意:
现在有人玩World of Darkraft - 2这个游戏, 游戏中有k (1 <= 100) 个装备栏, 每个装备栏初始的时候都是等级为1的装备, 现在开始打怪, 每次打死怪物之后系统爆出装备的规则是, 首先随机确定装备部位(k个部位概率相等)然后如果当前部位穿戴的装备等级是 t , 则随机爆出该部位对应等级为 [ 1, t + 1]的装备一件, 现在玩家在爆出装备后, 如果爆出的装备比当前穿戴的等级高, 则卖出穿戴的对应部位的装备然后换上等级高的, 否则直接卖掉爆出来的装备, 等级为 i 的装备可以卖得 i 金币, 问在打了 n ( n <= 1e5) 只怪物之后得到的金币数量的期望.
大致思路:
就是一个简单的概率DP, 不过感觉对于近似计算的时候误差的处理有点不好把握...
状态转移方程见代码注释部分
代码如下:
Result : Happy New Year! Memory : 16 KB Time : 1513 ms
/*
* Author: Gatevin
* Created Time: 2015/1/6 14:44:30
* File Name: Kotomi.cpp
*/
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;
/*
* 用E(Xi)表示第i个部位的装备在n次打怪之后得到的金币的期望
* 则要求的是E(∑Xi) (1 <= i <= k)
* 由于k个位置等价 E(Xi) = E(Xj) 1 <= i != j <= k;
* 所以E(∑Xi) = k*E(Xi)
* 那么只需要求出E(Xi)即可
* 用E[i][j]表示在打了i只怪之后, 当前部位的价值是j的时候, 该部位直到打怪结束得到金币的期望
* 那么E[i][j] = (1/k)*(∑(E[i + 1][j] + m)/(j + 1) + (E[i + 1][j + 1] + j)/(j + 1)) + (1 - 1/k)*E[i + 1][j];
* 其中 1 <= m <= j 卖掉爆出来的这个部位 换上这个爆出来的部位 爆的其他部位
* 化简得E[i][j] = (j/(k*(j + 1)) + (1 - 1/k))*E[i + 1][j] + j/(2*k) + j/(k*(j + 1)) + E[i + 1][j + 1]/(k*(j + 1))
* 初始化E[n][1 ~ (n + 1)] = 0
* E[0][1]即为解, 考虑到n <= 1e5, 使用滚动数组防止内存超出
* 但是O(n^2)的算法还是会超时, 这里考虑到误差为1e-9那么对E[0][1]做出贡献的式子当中, 试了一下当j > 600时的E[i][j]
* 对于E[0][1]的影响极小, 可以忽略不计, 那么O(600*n)是可以接受的
*/
double E[2][600];
int main()
{
memset(E, 0, sizeof(E));
int n, k;
scanf("%d %d", &n, &k);
int now = 1;
for(int i = n - 1; i >= 0; i--)
{
now ^= 1;
for(int j = 1; j < 600; j++)
E[now][j] = E[now ^ 1][j]*(j*1./(j + 1)/k + (k - 1)*1./k) + (j*1./2 + j*1./(j + 1))/k + 1./(j + 1)*E[now^1][j + 1]/k;
}
printf("%.9f\n", k*E[now][1]);
return 0;
}