算法——蓄水池抽样算法

1. 问题

给定一个数据流,数据流的长度 N N N未知,要求从中选择 m m m个数,每个数字被选择的概率都是 m N \frac{m}{N} Nm

2. 做法

有一个算法可以用于解决上述问题,该算法名称是蓄水池抽样算法。

算法的步骤如下:

  1. 若接收的数据流的长度小于 m m m,则直接把接收的数据放入蓄水池中。
  2. 当接收到第 i i i个数据时, i ≥ m i \ge m im,在区间 [ 0 , i ) [0,i) [0,i)中生成一个随机数random。若random < m,就替换把第random个蓄水池中的数据替换为第i个数据。
  3. 重复步骤2,直到处理完所有的数据。

3. 原理

4. 代码

4.1 生成随机数的方法
4.1.1 生成一个随机数
cout << rand() << endl;
4.1.2. 生成区间[a,b)一个随机数
cout << (rand() % (b - a)) + a << endl;
4.2 蓄水池抽样算法的代码
int cnt = 0;
int arr[m] = {};
while(cin >> x){
    if(cnt < m) arr[cnt] = x;
    else{
        int addr = rand() % (cnt + 1);  // 生成一个随机数
        if(addr < m) arr[addr] = x;
    }
    ++ cnt;
}

5. LeetCode例题

382.链表的随机节点
398.随机数索引

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值