470. 用 Rand7() 实现 Rand10() - 力扣(LeetCode)
概率题,拒绝采样
class Solution {
public:
int rand10() {
while(true){
int val = (rand7() - 1)*7 + rand7(); //1~49之间的随机数
if(val <= 40) return (val - 1)%10 + 1;
}
}
};
说说为什么这样可以吧,这一题的关键点是均匀,也即是生成的每个数的概率是一样的。
rand7()
可以均匀生成1-7之间的均匀随机数,那么rand7()-1
就可以生成0-6之间的均匀随机数,那么rand7() - 1 + rand7()
生成的数据是什么样的呢?
\ 0 1 2 3 4 5 6
1 1 2 3 4 5 6 7
2 2 3 4 5 6 7 8
3 3 4 5 6 7 8 9
4 4 5 6 7 8 9 10
5 5 6 7 8 9 10 11
6 6 7 8 9 10 11 12
7 7 8 9 10 11 12 13
第一行、第一列代表索引,可以看到rand7() - 1 + rand7()
可以生成1-13之间的随机数,但是并不均匀,比如生成数字1的概率为1/49,生成数字2的概率为2/49。为什么会出现这种情况呢?其实稍微学过一点概率的都了解过,这就像投掷两个骰子,求两个骰子的和的问题。这儿数字2有两种组成方式([1,1], [0,2]),而数字1只有一种,所以概率不均匀。
那我们怎样才能使概率均匀呢?或者说怎样才能使每个数字都只有一种组成方式呢?
把rand7()
看为一种类似7进制的操作,(rand7() - 1)*7 + rand7()
能够生成的数字是这样的:
\ 0 1 2 3 4 5 6
1 1 2 3 4 5 6 7
2 8 9 10 11 12 13 14
3 15 16 17 18 19 20 21
4 22 23 24 25 26 27 28
5 29 30 31 32 33 34 35
6 36 37 38 39 40 41 42
7 43 44 45 46 47 48 49
这一组数字的特点是,每一个数字都有且仅有一种组合,比如数字15只可能由14和1组合而成,也就是生成每个数字的概率都是相同的。本题里面我们需要的是1-10的随机数,我们既可以拒绝抽样把生成的大于40的数都舍弃,剩下的数先-1,然后对10取模,最后再+1就可以了。至于为什么可以,因为剩下的数1~40是10的整数倍,运算之后1-10之间是均匀的(可以简单算一下概率)。
最后再说说公式是这样的:(rand7() - 1)*7 + rand7()
- 第一项 -1 是为了使结果从0开始,这样加上第二项之后就可以产生1-7
- 第一项 7,为什么乘7,6不可以吗?8不可以吗?事实上6真不可以,而大于等于7的都可以。因为6会产生某个数由多个组合构成的情况(12 = 26, 12 = 1*6 + 6)。
最后的公式大概是这样的:
rand_N() 可以均匀生成[1, N]的随机数
那么:
(rand_X() - 1) × Y + rand_Y() (Y >= X)可以均匀生成[1, X * Y]的随机数
即实现 rand_XY()
之前舍弃的太多,优化一下,一样的思路:
class Solution {
public:
int rand10() {
while(1){
int val = (rand7() - 1)*7 + rand7();
if(val <= 40) return (val - 1)%10 + 1;
int num = val - 40;//1~9,且均匀
val = (num-1)*7 + rand7();//1~63
if(val <= 60) return (val-1)%10 + 1;
num = val - 60;//1~3
val = (num-1)*7 + rand7();//1~21
if(val <= 20) return (val-1)%10 + 1;
}
}
};