固定大小采样池中的随机采样证明

若对一个数据流维护一个固定大小的采样(例如s个元素),且对数据流当前到达的第n+1个数据元素以𝑠/(𝑛+1)概率决定其是否放入采样池中,并以概率1/𝑠随机置换采样池中某一元素,请证明该采样是一个随机采样。
证明:已知第n+1个元素以 𝑠/(𝑛+1)概率决定是否放入采样池中Pn+1=s/(𝑛+1)

设某元素在采样池中,可能性分2种
1、并未以第n+1次采样,采样出 (1-𝑠/(𝑛+1))设为 P1
2、发生了n+1次采样,但是目标元素未被置换 (𝑠/(𝑛+1)*s-1/s)设为 P2

P1+P2=n/n+1
此刻 发生的前提条件为第n个元素以 s/n 采样为前提
在这里插入图片描述符合第n+1个情况
∴该采样为一个随机采样

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值