百度面试题

最新推荐文章于 2017-05-09 15:06:24 发布

Jeff-Li

最新推荐文章于 2017-05-09 15:06:24 发布

阅读量1.1k

点赞数

分类专栏：程序员那点事

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/litianpenghaha/article/details/24003291

版权

程序员那点事专栏收录该内容

8 篇文章 0 订阅

订阅专栏

题目：为分析用户行为，系统常需存储用户的一些query，但因query非常多，故系统不能全存，设系统每天只存m个query，现设计一个算法，对用户请求的query进行随机选择m个，请给一个方案，使得每个query被抽中的概率相等，并分析之，注意：不到最后一刻，并不知用户的总请求量。

解析：

取一个[1,m+i]中的随机数，如果随机数落在(m,m+i]时，应该保留原来的m个数；如果随机数落在[1,m]中，则应该用最新的一条记录取代[1,m]中随机的一个数。
证明如下：
假设现在系统读取第n+1条记录，现在存储的m条记录都是前面m+n条记录中以m/(m+n)的概率留下来的；
取一个[1,m+n+1]的随机数，按照上述策略。
现在新记录能保留在m数组的概率为m/(m+n+1)
原来m数组中的数（设为A）在本轮选择中还能保留的条件概率（条件是，上一轮选择中，A被保留）：
(n+1)/(m+n+1)+m/(m+n+1)*(1-1/m)=(m+n)/(m+n+1)。
然后要乘以其原来保留下的概率。得到的A仍在m数组中的概率为m/(m+n+1)。

简单而言就是分为两种情况：

1、原来m数组中的数被替换成功的概率：

就是说这个数本来肯定被选中了，而且被新选择的人一个所替换（但是不包括新添加的那个数，由于新添加，不好加入选择队列）

m/(m+n)*(m+n)/(m+n+1)=m/(m+n+1)

2、原来m数组中的数保留下来的概率：

新的选择情况下选择了[1,m]之间的数但是并没有替换这个数

m/(m+n+1)*(1-1/m)=(m-1)/(m+n+1)

当m<<n的时候，这两个值几乎相等。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
百度面试题

题目：为分析用户行为，系统常需存储用户的一些query，但因query非常多，故系统不能全存，设系统每天只存m个query，现设计一个算法，对用户请求的query进行随机选择m个，请给一个方案，使得每个query被抽中的概率相等，并分析之，注意：不到最后一刻，并不知用户的总请求量。解析：取一个[1,m+i]中的随机数，如果随机数落在(m,m+i]时，应该保留原来的m个数；如果随机数落在[1
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。