题目:依次读取某数组中的元素,元素的数量是有限但未知的。读取完所有元素后,请返回这些元素中的某一个。要求数组中的每一个元素都有相同的概率被选中。(只有O(1)的存储空间)
思路:设置一个变量 x,每读取一个元素就有一定概率用该元素的值刷新 x ,全部读取完后返回 x. 其中,第一个元素刷新x的概率为1,第二个元素为 1/2, 第三个元素 1/3... 依次类推。
证明:考察第 k 个读入的元素,根据以上思路,它刷新 x 的概率为 1/k。 那么最终返回的 x 就是第 k 个元素的概率P(k)是多少呢?首先,k之前的元素对P(k)是没有任何影响的,k要被返回就必须满足:k 刷新了x,且 k 后面所有的元素都没有刷新 x. 这个概率的大小为 ,其中N是数组总长度。即P(k)与 k 无关,是个常数值 1/N, 数组中所有元素被选中的概率均为 1/N.
int ans,num,i=1;
while (cin >> num && num!=stop_flag)
if (!(rand() % i++)) ans = num;
return ans;