昨天面试字节,手写代码之后进一步考查了一道题。面试官让我说一下有什么思路。
题目如下:
有一个函数int getNum(),每运行一次可以从一个数组V[N]里面取出一个数,N未知,当数取完的时候,函数返回NULL。现在要求写一个函数int get(),这个函数运行一次可以从V[N]里随机取出一个数,而这个数必须是符合1/N平均分布的,也就是说V[N]里面任意一个数都有1/N的机会被取出,要求空间复杂度为O(1)。
我当时的思路是如果随机抽取,那么肯定要用到random
方法,另外如果不能获得数组长度,那么取数过程中我能用到的数据只有:当前数字的值
及当前数字的索引
。随后就看如何构建函数保证每个数字的被取出的概率相同即可。
不过具体如何构建函数,我没有想到。
结束后,我查询了一下相关的解析如下:
- 设置一个整形nVal,用来存放get()返回的数。
- 调用getNum()从V[N]取数,按一定概率存入nVal中(覆盖以前的),直到getNum()返回NULL。
- 设getNum取的第i个数为nVali,nVali存入nVal中的概率为Pi。 设Pi=1/i (i已知时,所以这个概率很容易做到)。
- 则nVali保留,并最后返回的情况是,nVali被存入num中,且nValj(i<j<=N)不被存入nVal。
其概率为
P(nVali)=Pi*(1- Pi+1) * (1 - Pi+2)* …(1 - PN)
=1/i