常用算法-蓄水池抽样算法

Leetcode上遇到一道题,题目是这样的:

这道题的关键是链表的长度不知道,但是要使随机返回每个元素的概率相等,这一下就难倒我了,如果知道链表的长度k,从0到k中随机选择一个整数就好了呀,可现在不知道长度k的值。不过没关系,蓄水池抽样算法给了我们在不知道长度的情况下,等概率随机抽样的方法。

假设我们要从一大堆元素中选择k个元素,不知道多少,反正很多很多。使用蓄水池抽样算法的具体的思路是:先初始化一个集合,集合中有k个元素,将此集合作为蓄水池。然后从第k+1个元素开始遍历,并且按一定的概率替换掉蓄水池里面的元素。伪代码是这样的:

Init : a reservoir with the size: k  
for i= k+1 to N  
    M=random(1, i);  
    if( M < k)  
     SWAP the Mth value and ith value  
end for

具体描述如下:先将前k个数取出来放入结果集中,然后从第k+1个数开始遍历。假设遍历到第i个数,以k/i的概率替换掉蓄水池中的某个元素即可。

是不是很好理解?接下来,我们来看看,为什么使用这种算法抽取到每个元素的概率是相等的,这里我们使用数学归纳法:

问题描述:

取前k个元素放入蓄水池中。从i=k+1开始,以k/i的概率取第i个元素。若第i个元素被选中,已均等的概率(即1/k)替换蓄水池中的先前被选中的任一元素。

证明:

这样,我们就证明了用蓄水池抽样算法抽取每个元素的概率是相等的。

问题求解

所以,回到上面的leetcode问题,我们得到的答案如下:

# Definition for singly-linked list.
# class ListNode(object):
#     def __init__(self, x):
#         self.val = x
#         self.next = None

class Solution(object):

    def __init__(self, head):
        """
        @param head The linked list's head.
        Note that the head is guaranteed to be not null, so it contains at least one node.
        :type head: ListNode
        """
        self.head = head

    def getRandom(self):
        """
        Returns a random node's value.
        :rtype: int
        """
        result,node,index = self.head,self.head.next,1
        while node:
            if random.randint(0,index) == 0:
                result = node
            node = node.next
            index = index + 1
        return result.val
        


# Your Solution object will be instantiated and called as such:
# obj = Solution(head)
# param_1 = obj.getRandom()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值