题目描述:
“给出一个数据流,这个数据流的长度很大或者未知。并且对该数据流中数据只能访问一次。请写出一个随机选择算法,使得数据流中所有数据被选中的概率相等。”
解决办法:
数据工程师必知算法:蓄水池抽样
蓄水池抽样算法证明
海量数据随机抽样问题(蓄水池问题)
题目描述:
“给出一个数据流,这个数据流的长度很大或者未知。并且对该数据流中数据只能访问一次。请写出一个随机选择算法,使得数据流中所有数据被选中的概率相等。”
解决办法:
数据工程师必知算法:蓄水池抽样
蓄水池抽样算法证明
海量数据随机抽样问题(蓄水池问题)
转载于:https://my.oschina.net/letiantian/blog/282959