如何从n个数中等概率的取出k个数?(n是不确定的或者确定的) 概率为k/n
蓄水池抽样:先将前k个数取出来放入结果集中,然后从第k+1个数开始遍历。假设遍历到第i个数,以k/i的概率去第i个数去替换掉蓄水池中的某个元素。
init: a reservior with size: k
for i = k+1 to N:
t = random(0,i); //[0,..i]
if(t < k)
swap the value of index i and t
end for
证明:
/**
* Definition for singly-linked list.
* struct ListNode {
* int val;
* ListNode *next;
* ListNode(int x) : val(x), next(NULL) {}
* };
*/
class Solution {
private:
ListNode* head;
public:
Solution(ListNode* head) {
this->head = head;
}
/** Returns a random node's value. */
int getRandom() {
vector<int> v;
ListNode* cur = head;
int res = cur->val;
int count = 1;
cur = cur->next;
while(cur){
int t = rand()%(count+1);
if(t == 0){
res = cur->val;
}
count++;
cur = cur->next;
}
return res;
}
};
leetcode 384打乱数组
洗牌算法:在前n-1张牌洗好的情况下,第n张牌随机与所有牌中的其中一张牌交换。t = rand % (i + 1) if(i != t) swap。
使得每张牌出现在各个位置的概率是相等的(1/N)
当N=1时,显然成立
当N=2时,每张牌出现在两个位置的概率都是1/2
假设当N=k时成立,现在证明当N=k+1的时候也成立,即每张牌出现在各个位置的概率均为(1/N+1)
分成三部分来看:第k+1张牌到所有位置,前k张牌到第k+1个位置,前k张牌到前k个位置
第k+1张牌到所有位置:显然,第k+1张牌到所有位置的概率均为1/(k+1)–>算法就是这么写的。
前k张牌到第k+1个位置:与第k+1张牌到所有位置是对称的。
前k张牌到前k个位置:我们知道当N=k的时候成立,所以不考虑第k+1张牌,前k张牌在前k个位置的概率是1/k,但是现在有了第k+1张牌,我们还要保证前k张牌中的某一张不被交换走到第k+1个位置,概率是1-1/(k+1) 。
根据贝叶斯公式:(1/k) * (1-1/(k+1)) = 1/(k+1)