SP1026 FAVDICE - Favorite Dice

Label

期望DP经典例题

Description

一个n面的骰子,求期望掷几次能使得每一面(每一种点数)都被掷到。

数据范围: n ≤ 1000 n\leq 1000 n1000,共 t ( t ≤ 1000 ) t(t\leq 1000) t(t1000)组数据。

Solution
一种正确但不可行的想法

一开始想着设 d p [ i ] [ j ] dp[i][j] dp[i][j]为投掷了 i i i次骰子后扔到过 j j j个不同面所经过次数的期望,那么这个转移式还是比较好想的:

d p [ i ] [ j ] = n − ( j − 1 ) n d p [ i − 1 ] [ j − 1 ] + j n d p [ i − 1 ] [ j ] ( d p [ 1 ] [ 1 ] = 1 ) dp[i][j]=\frac{n-(j-1)}{n}dp[i-1][j-1]+\frac{j}{n}dp[i-1][j](dp[1][1]=1) dp[i][j]=nn(j1)dp[i1][j1]+njdp[i1][j](dp[1][1]=1)

a n s = ∑ i = n ∞ d p [ i ] [ n ] ans=\sum_{i=n}^{\infty}dp[i][n] ans=i=ndp[i][n]

d p [ i ] [ j ] dp[i][j] dp[i][j]由两种情况转移而来:1、 d p [ i − 1 ] [ j ] dp[i-1][j] dp[i1][j]:扔了一次骰子还是已出现过的 j j j面中的一种, p = j n p=\frac{j}{n} p=nj;2、 d p [ i − 1 ] [ j − 1 ] dp[i-1][j-1] dp[i1][j1]:扔了一次骰子不是已出现过的 j − 1 j-1 j1面中的一种, p = n − ( j − 1 ) n p=\frac{n-(j-1)}{n} p=nn(j1)

但是,这种正向推导的方法有一种显然的问题:理论上存在扔无限次骰子而始终无法使得每一面都被掷到的可能性,故此答案没法统计( a n s ans ans收敛于何处实在难求),故我们考虑不依赖于步数的新状态。

正推?

d p [ i ] dp[i] dp[i]表示恰好投出 i i i种不同点数的期望投掷次数,初始状态为 d p [ 1 ] = 1 dp[1]=1 dp[1]=1,问题来了: d p [ i ] dp[i] dp[i]由何转移得到?应由 d p [ i − 1 ] dp[i-1] dp[i1] d p [ i ] dp[i] dp[i]。到了这里, d p [ i − 1 ] dp[i-1] dp[i1] d p [ i ] dp[i] dp[i]的概率为 n − i + 1 n \frac{n-i+1}{n} nni+1 d p [ i ] dp[i] dp[i] d p [ i ] dp[i] dp[i]的概率为 i n \frac{i}{n} ni,概率和不为1,不可行。

逆推

d p [ i ] dp[i] dp[i]表示当前已投出过 i i i种不同点数后投掷的期望次数,那么考虑在 f [ i ] f[i] f[i]状态下投掷一次骰子,显然有 i n \frac{i}{n} ni的概率又扔到原有的 i i i面骰子, f [ i ] f[i] f[i]转移到 f [ i ] f[i] f[i],有 n − i n \frac{n-i}{n} nni的概率扔到原来没扔到的 n − i n-i ni面骰子, f [ i ] f[i] f[i]转移到 f [ i + 1 ] f[i+1] f[i+1],所以:

d p [ i ] = i n ( d p [ i ] + 1 ) + n − i n ( d p [ i + 1 ] + 1 ) dp[i]=\frac{i}{n}(dp[i]+1)+\frac{n-i}{n}(dp[i+1]+1) dp[i]=ni(dp[i]+1)+nni(dp[i+1]+1)

其中, d p [ n ] = 0 dp[n]=0 dp[n]=0

化为标准递归公式的形式,即为: d p [ i ] = d p [ i + 1 ] + n n − i dp[i]=dp[i+1]+\frac{n}{n-i} dp[i]=dp[i+1]+nin

(别忘了转移的时候我们扔了一次骰子!)

Code
#include<cstdio>
#include<iostream>
#define ri register int
using namespace std;

const int MAXN=1020;
int t,n;
double dp[MAXN],ans;

int main()
{
	scanf("%d",&t);
	for(ri opt=1;opt<=t;opt++)
	{
		scanf("%d",&n);
		dp[n]=0;
		for(ri i=n-1;i>=0;i--)
			dp[i]=dp[i+1]+(double)n/(double)(n-i);
		printf("%.2f\n",dp[0]);
	}	
	return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值