java实现随机抽取题目_随机抽取样本问题&蓄水池算法&按权重抽取问题

面试被问到的一个问题:从N个样本中随机抽取m个样本,要求每个样本被抽取的概率一致。升级1:要求精准抽到m个;升级2:对每个样本添加权重,要求抽取概率按照权重分配。基础问题问题描述:从N个样本中随机抽取m个样本,要求每个样本被抽取的概率一致,求怎么样抽取?数据量为百万级。看到这个问题,最先想到的方法是,依次遍历每个样本,以的概率抽中当前样本作为最后中的一个,具体操作可以是:1、每遍历一个样本,生成一...
摘要由CSDN通过智能技术生成

面试被问到的一个问题:从N个样本中随机抽取m个样本,要求每个样本被抽取的概率一致。升级1:要求精准抽到m个;升级2:对每个样本添加权重,要求抽取概率按照权重分配。

基础问题

问题描述:从N个样本中随机抽取m个样本,要求每个样本被抽取的概率一致,求怎么样抽取?数据量为百万级。

看到这个问题,最先想到的方法是,依次遍历每个样本,以

math?formula=%5Cfrac%7Bm%7D%7Bn%7D的概率抽中当前样本作为最后

math?formula=m中的一个,具体操作可以是:

1、每遍历一个样本,生成一个

math?formula=0%5Csim%20N之间的随机数

math?formula=x,对比

math?formula=x

math?formula=m的大小;

2、若

math?formula=x大于

math?formula=m,说明属于

math?formula=%5Cfrac%7B1-m%7D%7Bn%7D概率内,不抽;若

math?formula=x小于等于

math?formula=m,说明属于

math?formula=%5Cfrac%7Bm%7D%7Bn%7D概率内,抽它;

3、直到所有样本遍历结束。

还可以从另一个角度证明这个算法的公平性,对每个抽中的样本来说,它应该是被抽中的第

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值