BZOJ 1426 收集邮票 概率DP

题目描述 Description
有n种不同的邮票,皮皮想收集所有种类的邮票。唯一的收集方法是到同学凡凡那里购买,每次只能买一张,并且买到的邮票究竟是n种邮票中的哪一种是等概率的,概率均为1/n。但是由于凡凡也很喜欢邮票,所以皮皮购买第k张邮票需要支付k元钱。现在皮皮手中没有邮票,皮皮想知道自己得到所有种类的邮票需要花费的钱数目的期望。

输入描述 Input Description
一行,一个数字N

输出描述 Output Description
要付出多少钱. 保留二位小数

样例输入 Sample Input
3

样例输出 Sample Output
21.25

数据范围及提示 Data Size & Hint
1<=N<=10000 1 <= N <= 10000

Solution

f[i] f [ i ] 表示现在取到 i i 张邮票,要取完剩下邮票的期望次数
显然f[n]=0
现在已经取得 i i 张邮票,所以下一次取邮票有in的概率取到已经有的,期望为 inf[i] i n ∗ f [ i ]
nin n − i n 的概率取到没有的,期望为 ninf[i+1] n − i n ∗ f [ i + 1 ] ,这次取邮票的期望为1,所以总期望为:

f[i]=inf[i]+ninf[i+1]+1 f [ i ] = i n ∗ f [ i ] + n − i n ∗ f [ i + 1 ] + 1

化简可得: f[i]=f[i+1]+nni f [ i ] = f [ i + 1 ] + n n − i

g[i] g [ i ] 表示现在取到 i i 张邮票,要取完剩下邮票的期望价格
显然g[n]=0
现在已经取得 i i 张邮票,所以下一次取邮票有in的概率取到已经有的,期望为 in(g[i]+f[i]+1) i n ∗ ( g [ i ] + f [ i ] + 1 ) ,有 nin n − i n 的概率取到没有的,期望为 nin(g[i+1]+f[i+1]+1) n − i n ∗ ( g [ i + 1 ] + f [ i + 1 ] + 1 ) 所以总期望为:

g[i]=in(g[i]+f[i]+1)+nin(g[i+1]+f[i+1]+1) g [ i ] = i n ∗ ( g [ i ] + f [ i ] + 1 ) + n − i n ∗ ( g [ i + 1 ] + f [ i + 1 ] + 1 )

化简可得: g[i]=inif[i]+g[i+1]+f[i+1]+nni g [ i ] = i n − i ∗ f [ i ] + g [ i + 1 ] + f [ i + 1 ] + n n − i

前面的推导貌似很自然的样子,但是为啥 g[i] g [ i ] 的推导式看着就那么奇怪呢?
那是因为式子的结构表示的是每次都将后面取到的邮票费用+1(总费用+f[i]),再加上自己的费用(+1)
这样就很好理解了

为啥不是 f[0](f[0]+1)/2n f [ 0 ] ∗ ( f [ 0 ] + 1 ) / 2 ∗ n 我也想了很久
因为推导过来每次的贡献是不相同的
比如说所有情况中有1次需要取2张,1次需要取3张,那么总贡献为 (3+6)/2=4.5 ( 3 + 6 ) / 2 = 4.5 ,而期望次数为2.5,显然是不对的…

代码比思考简单多了

#include <bits/stdc++.h>
using namespace std;
int n;
double f[10005],g[10005];
int main() {
    scanf("%d",&n);
    for(int i=n-1;~i;--i) {
        f[i]=f[i+1]+(1.0*n)/(1.0*(n-i));
        g[i]=(1.0*i)/(1.0*(n-i))*(f[i]+1)+g[i+1]+f[i+1]+1;
    }
    printf("%.2lf\n",g[0]);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值