本文题目来源于leetcode,原题给出一个未知大小链表,要求返回一个随机节点的值,且返回每个节点的概率一定。(PS 一直弄不明白OJ怎么判断概率)
蓄水池抽样(Reservoir Sampling )能够在o(n)时间内对n个数据进行等概率随机抽取,对于未知的大小的数据抽样效果很好,而且能够应对数据一直增加的情况。
蓄水池抽样的主要思想是,先选定第一个样本,而后的第i个样本有1 / i 的几率替换之前的样本,可以证明,每个节点最终被选中的概率都是1/n,证明过程可以参照这篇博文。http://www.cnblogs.com/hrlnw/archive/2012/11/27/2777337.html
下面回到算法题目中,我觉得比较重要的几点是,C++中随机引擎的使用以及静态变量的使用。
- 随机引擎
C++11 标准在random头文件中提供了不同分布类型的随机数引擎,可以根据不同使用需要定义随机数分布类型,比如均匀分布uniform_int_distribution ,正态分布normal_distribution等。同时应该定义一个随机数引擎,一般为default_random_engine,具体应用可见下方代码。 - 静态变量
由于计算机产生的随机数都是伪随机数,对于相同的随机数引擎会产生一个相同的随机数序列,因此,如果不使用静态变量(static)&#x