原创作品,出自 “晓风残月xj” 博客,欢迎转载,转载时请务必注明出处(http://blog.csdn.net/xiaofengcanyuexj)。
本文介绍了储水池抽样算法(Reservoir Sampling Algorithm),适用于样本空间总数未知或很大的情况,保证每个样本被选中的概率为k/n。算法通过不断以k/i的概率替换蓄水池中的样本,实现O(n)的时间复杂度和O(k)的空间复杂度。在分布式系统和抽奖解决方案中有应用,文中还给出了Java实现的源代码。
原创作品,出自 “晓风残月xj” 博客,欢迎转载,转载时请务必注明出处(http://blog.csdn.net/xiaofengcanyuexj)。
186

被折叠的 条评论
为什么被折叠?