java实现随机抽取题目_随机抽取样本问题&蓄水池算法&按权重抽取问题

本文介绍了如何使用Java解决从N个样本中随机抽取m个样本的问题,保证每个样本被抽取的概率一致。首先,讨论了基础问题的解决方案,通过遍历并比较随机数来实现等概率抽取。接着,提出了蓄水池算法确保抽取m个样本。最后,引入了样本权重,通过调整概率实现按权重抽取,并探讨了权重概率计算的疑问。
摘要由CSDN通过智能技术生成

面试被问到的一个问题:从N个样本中随机抽取m个样本,要求每个样本被抽取的概率一致。升级1:要求精准抽到m个;升级2:对每个样本添加权重,要求抽取概率按照权重分配。

基础问题

问题描述:从N个样本中随机抽取m个样本,要求每个样本被抽取的概率一致,求怎么样抽取?数据量为百万级。

看到这个问题,最先想到的方法是,依次遍历每个样本,以

math?formula=%5Cfrac%7Bm%7D%7Bn%7D的概率抽中当前样本作为最后

math?formula=m中的一个,具体操作可以是:

1、每遍历一个样本,生成一个

math?formula=0%5Csim%20N之间的随机数

math?formula=x,对比

math?formula=x

math?formula=m的大小;

2、若

math?formula=x大于

math?formula=m,说明属于

math?formula=%5Cfrac%7B1-m%7D%7Bn%7D概率内,不抽;若

math?formula=x小于等于

math?formula=m,说明属于

math?formula=%5Cfrac%7Bm%7D%7Bn%7D概率内,抽它;

3、直到所有样本遍历结束。

还可以从另一个角度证明这个算法的公平性,对每个抽中的样本来说,它应该是被抽中的第

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值