等概率随机取数算法的几种实现(洗牌算法）

最新推荐文章于 2024-08-08 21:46:08 发布

zuimrs

最新推荐文章于 2024-08-08 21:46:08 发布

阅读量6.9k

点赞数 1

分类专栏：算法文章标签：算法随机洗牌等概率取数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zuimrs/article/details/81014906

版权

博客介绍了等概率随机取数算法的优化方案，包括Fisher-Yates Shuffle和Knuth-Durstenfeld Shuffle算法，讨论了它们的时间复杂度和适用场景。此外，还讲解了在数据流中使用蓄水池抽样进行等概率取数的方法，以应对无法存储全部数据的情况。

摘要由CSDN通过智能技术生成

等概率随机取数算法的几种实现

　　最近读了项目中的工具脚本，发现一个随机取数的函数，功能大概是从M个数中不重复的随机取出N个数，算是数组随机排序然后取前N个值的变种。

　　脚本实现采取原始的方法，每随机取一个数就放到一个数组中，下次取数时遍历结果数组判断是否已经取出，平均时间复杂度为O(MlogM),空间复杂度O(N),效率不高。

　　想了一下解决方案，能优化的地方应该就是将遍历数组判断是否取出使用哈希或者红黑树实现，以空间换时间，虽然可以降低时间复杂度，但原算法仍存在问题：当M接近于N的时候，效率会急剧下降，十分恐怖。

　　如果借助洗牌算法，获取一个随机排列的子集，便能实现等概率随机取数的功能。

1. Fisher-Yates Shuffle算法

　　最早于1938年由Ronald Fisher和Frank Yates所著《Statistical tables for biological,agricultural and medical research》提出，算法描述为：

将1到N数字存到数组中
从数组中取一个1到剩下数字个数的随机数k
从低位开始，将数组第k个数字取出，并保存到结果数组末尾
重复第2步，直到所有数字都被取出
第3步得到的结果数组就是所求的随机序列

该算法存在对数组随机元素的删除操作，时间复杂度O(N^2),空间复杂度O(M),效率仍然比较低。

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。