这两天没事,就写了写数学课上老师说的那个“蒲丰投针实验"的程序。接触到了一些随机数生成方面的东西,写出来跟大家分享一下。
对于计算机生成随机数这个东西,以前有过一些浅显的认识。只知道计算机不能生成真正的随机数,只能用一定的方法来模拟随机数,叫做伪随机数。比如C语言里面的rand()函数,就是一个伪随机数发生器。之前也知道有个叫做seed的东西,知道每次调用rand()之前都需要重置一下seed。以往的编程当中,一般都用系统时间来产生seed。但是seed是什么东西,为什么要用seed,则完全不清楚是怎么一回事了。
网上的一些文章中提到,C语言中伪随机数生成算法实际上是采用了"线性同余法”。具体的计算如下:
Xi = (Xi-1 * A + C ) mod M
其中A,C,M都是常数(一般会取质数)。当C=0时,叫做乘同余法。srand()函数置的seed实际上会作为X0被代入上式中,然后每次调用rand()函数都会用上一次产生的随机值来生成新的随机值。这样我们可以看出实际上用rand()函数生成的是一个递推的序列,一切值都来源于最初的seed。这就不难解释为什么当初始的seed取一样的时候,得到的序列都相同。也就解释了为什么我们需要调用系统时间这种变化的值来充当seed了。
C语言里面有RAND_MAX这样一个宏,定义了rand()所能得到的随机值的范围。在C里可以看到RAND_MAX被定义成0x7fff,也就是32767。据此我们可以推测rand()函数里递推式中M的值就是32767。据说在LInux里面这个值被定义的更大一些,也就是说LInux里生成的随机值的范围更大。
线性同余法生成的随机数的随机性并不是很好,并不是真正的满足均匀分布,仅仅能满足一般的要求。 用这个做概率方面的模拟还是很有限的,网上搜到了一些关于计算机模拟的文章,提到了一些很专业的方法,比如蒙特卡洛方法等等。由于没想深入,就没往下看。
比较有意思的是在CSDN上搜到了sjd163一篇文章讲到了一种通过交换来得到随机序列的方法。主要的依据是热力学第二定律的熵增加原理。主要的思想是将有序的序列通过一定的交换将有序变成无序。思想类似于扑克牌的洗牌。假设扑克牌是从小到大的顺序放好的,通过多次的洗牌之后扑克牌的顺序性就逐渐消失,变的随机。换句话说,系统的熵值变大。而且这种过程是不可逆的,只能从有序变成无序,不能从无序变成有序。
假设现在有一个数组,从小到大存放了一定数字。我们按照对插、倒排、交换、块分割等等方法对这个数组进行多轮的处理。原先包含在数组中的顺序关系就被我们逐渐打乱了。当然,为了使过程不可逆,我们可以在这些过程(比如交换)中引入简单伪随机值。通过n轮的处理之后,我们可以假设现在数组已经变成了随机序列。可以对结果进行概率分布的检验,如果检验不通过,重新进行处理,直到到达可以认为是随机序列的程度。
看到这个方法的时候,我突然回想起来我似乎也曾将用过这种方法来生成随机数。当时没有多想,写完就完了。没想到居然还蕴含着这么深刻的道理,pfpf。
可惜的是我用这两种方法都进行了模拟,算出来的圆周率仍然不是很精确,最多也就到3.141左右。看来生成的随机数还是不怎么好。用于计算机模拟随机数生成算法应该会更好一些吧(据说用matlab生成的就比较好)
这里是我的源码,有兴趣可以看看。
我参考的一些资源和帖子都收集在MyDiigo里随机数的tag中,也可以看看。