n 中选 m —— 随机采样的艺术

最新推荐文章于 2024-04-11 11:38:08 发布

五道口纳什

最新推荐文章于 2024-04-11 11:38:08 发布

阅读量1.9k

点赞数

分类专栏：数据结构

本文链接：https://blog.csdn.net/lanchunhui/article/details/81037720

版权

数据结构专栏收录该内容

82 篇文章 4 订阅

订阅专栏

0,1,2…n-1，n 个数中随机取 m 个数，要求 0, 1, n-1，此 n 个数每个数被取到的概率相同：

Knuth 书中的随机化方法，很容易写出：

void genkunth (int n, int m) {
    for (int i = 0; i < n; ++i) {
        if (bigrand() % (n-i) < m) {
            m--;
            cout << i << endl;
        }
    }
}

该算法的特点分析如下：

当 n == m 时，if 判断式恒成立，输出的结果也恒定为 0, 1, 2, … n-1;
- n-i 每次循环一定发生，m– 未必发生；则 n-i 一定小于 m，对 n-i 取模也必然小于 m；
当 n > m 时，最坏的情况，前 n-m 次随机都不满足条件（if 均不成立），第 n-m+1 次随机必然成立；
故一定可以输出 m 个随机数，
- 当 n == m, 输出为 0, 1, 2, … n-1
- 当 n > m, 输出 m 个有序的介于 0-n-1 之间的数；