有不同的方法来实现这一点,哪个更合适将取决于您需要从多少数量中选择的数量.
>如果您从大量潜在数字中选择少量随机数,那么您最好只将先前选择的数字存储在一组中,然后“手动”检查重复项.大多数情况下,您实际上不会获得重复,并且实际上测试的成本几乎为零.听起来可能不那么优雅,但实际上并不像听起来那么糟糕.
>某些基础随机数生成算法不会在“原始”级别生成重复项.因此,例如,称为XORShift生成器的算法可以有效地生成特定范围内的所有数字,并且没有重复地进行混洗.所以你基本上在序列中选择一个随机的起始点然后只生成下面的n个数字,你知道不会有重复.但是在这种情况下你不能随意选择“max”:它必须是所讨论的发生器的自然最大值.
>如果可能数字的范围很小,但您需要选择的数字的数量在该范围的几个数量级内,那么您可以将其视为随机选择问题.例如,要选择10,000,000范围内的100,000个数字而不重复,我可以这样做:
Let m be the number of random numbers I’ve chosen so far
For i = 1 to 10,000,000
Generate a random (floating point) number, r, in the range 0-1
If (r < (100,000-m)/(10,000,000-i)), then add i to the list and increment m
随机播放列表,然后根据需要从列表中依次选择数字
但显然,如果你需要选择一些相当大比例的数字,那么选择后一种选择只有很多意义.为了选择1到10亿范围内的10个数字,你将产生10亿个随机数,当你只是检查重复数据时,你实际上不太可能得到重复,并且最终只会生成10个随机数数字.