蓄水池采样算法

蓄水池采样算法
前段时间在笔试题上遇到这样一个程序题,假设总共有m个元素,从中随机抽取n个元素,要求每个元素被取到的概率相等。其中m有无限大,即无法通过一次遍历知道有多少个元素。

算法过程:
设总共有m个元素,需要采集n个元素。
首先构建一个数组,将前n个元素存放进数组中,这个数组也叫做蓄水池。
接着,从i=n+1个数开始,任取r为0~n之间的整数,如果r>n,则不进行替换,否则,将蓄水池中的第r个元素,替换为i。
只需要通过一次遍历,就能完成采样,每个元素都有n/m的概率被抽到,时间复杂度为需要遍历的元素个数,即O(m)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值