Reservoir Sampling

Reservoir Sampling:从N个数中随机抽取k个元素,保证每个元素被选中的概率相等,N不知道有多大。

分析:这个问题称为蓄水池抽样,经典方法:

Init : a reservoir with the size: k

for(int i = k + 1; i  <= N; ++i)

{

    m = random(1, i);

    if(k >= m)

        swap the mth value with the ith value;

}

这个每个元素被选择的概率为k/N,证明网上很多。

简单证明:假设现在从第i+1个选择下一个元素,现证明每一个元素被选中的概率为k/(i + 1)。

对于第i + 1 个元素,它被选择的概率显然为k/(i+1)(从i+1个元素中生成一个随机数,小于等于k则被选择),对于前i个已经被选择的元素,在第i+1次选择后,仍被选择的概率为 (第i+1个元素被选择但是未被替换的概率+ 第i+1个元素未被选择的概率),前者为 k/(i+1) * (k-1/k),后者为( i+1-k)/(i+1),相加得 i/(i+1),即从前i+1个元素中选择,每个元素被选择的概率为k/i * i/(i+1) = k/(i+1).

题目1. 给你一个长度为N的链表。N很大,但你不知道N有多大。你的任务是从这N个元素中随机取出k个元素。你只能遍历这个链表一次。你的算法必须保证取出的元素恰好有k个,且它们是完全随机的(出现概率均等)。

蓄水池的应用

题目2.给你一个数组A[1..n],请你在O(n)的时间里构造一个新的数组B[1..n],使得B[i]=A[1]*A[2]*...*A[n]/A[i]。你不能使用除法运算.

我觉得这个和上面算法没关系,不知道为什么有人将它写这里,利用r[i] = a[1]*a[2]*...*a[i],l[i] = a[n]*a[n-1]*...*a[i],则B[i] = r[i-1]*l[i+1].

转载于:https://www.cnblogs.com/buptLizer/archive/2012/04/08/2437416.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值