杨中科 (传智播客.Net高级讲师)
主讲课程:如鹏网项目、移动开发、游戏开发
个人简介:CSDN学生大本营2009年度十佳老师。曾任职于微软中国、金蝶软件等知名IT企业。撰写了《自己动手写开发工具》、《程序员的SQL学习笔记》等技术图书。主导了金蝶EAS湖南烟草局SCM系统、字符终端图形库AHA3及开发工具AHAIDE、上海浦东发展银行图形前端等项目的开发,并且在中国工商银行批量平台、集中监控运维系统(部署于中国工商银行、中国农业银行、交通银行、北京银行、深圳发展银行等大中型银行)、力诺集团呼叫中心、新广源集团呼叫中心等项目中担任主力开发人员。
编者按:随机数,是指专门的随机试验的结果。在统计学的不同技术中需要使用随机数。在软件开发领域,随机数常常被用于各类编程语言中,大多程序员或许没注意到,在随机数产生器或算法中,很容易出现一些微小的漏洞,但这些漏洞可能会导致灾难性的结果。本文作者在解析随机数运用于编程时的易错点,以及规避错误的方法,同时语重心长地告诉程序员,如果只是会使用语言、工具,那么就只是一个“小码农”,程序员只有明白技术背后的原理,才会成为“软件工程师”,才能在IT行业得以长足发展。
几乎所有编程语言中都提供了“生成一个随机数”的方法,也就是调用这个方法会生成一个数,我们事先也不知道它生成什么数。比如在.Net中编写下面的代码:
Random rand = new Random();
Console.WriteLine(rand.Next());
运行后结果如下:
Next()方法用来返回一个随机数。同样的代码你执行和我的结果很可能不一样,而且我多次运行的结果也很可能不一样,这就是随机数。
一、陷阱
看似很简单的东西,使用的时候有陷阱。我编写下面的代码想生成100个随机数:
for(int i=0;i<100;i++)
{
Random rand = new Random();
Console.WriteLine(rand.Next());
太奇怪了,竟然生成的“随机数”有好多连续一样的,这算什么“随机数”呀。有人指点“把new Random()”放到for循环外面就可以了:
Random rand = new Random();
for(int i=0;i<100;i++)
{
Console.WriteLine(rand.Next());
}
运行结果:
确实可以了!
二、这是为什么呢?
这要从计算机中“随机数”产生的原理说起了。我们知道,计算机是很严格的,在确定的输入条件下,产生的结果是唯一确定的,不会每次执行的结果不一样。那么怎么样用软件实现产生看似不确定的随机数呢?
生成随机数的算法有很多种,最简单也最常用的就是 “线性同余法”:第n+1个数=(第n个数*29+37) % 1000,其中%是“求余数”运算符。很多像我一样的人见了公式都头疼,我用代码解释一下吧,MyRand是一个自定义的生成随机数的类:
class MyRand
{
private int seed;
public MyRand(int seed)
{
this.seed = seed;
}
public int Next()
{
int next = (seed * 29 + 37) % 1000;
seed = next;
return next;
}
}
如下调用:
MyRand rand = new MyRand(51);
for (int i = 0; i < 10; i++)
{
Console.WriteLine(rand.Next());
}
执行结果如下:
生成的数据是不是看起来“随机”了。简单解释一下这个代码:我们创建MyRand的一个对象,然后构造函数传递一个数51,这个数被赋值给seed,每次调用Next方法的时候根据(seed * 29 + 37) % 1000计算得到一个随机数,把这个随机数赋值给seed,然后把生成的随机数返回。这样下次再调用Next()的时候seed就不再是51,而是上次生成的随机数了,这样就看起来好像每一次生成的内容都很“随机”了。注意“%1000”取余预算的目的是保证生成的随机数不超过1000。
当然无论是你运行还是我每次运行,输出结果都是一样的随机数,因为根据给定的初始数据51,我们就可以依次推断下来下面生成的所有“随机数”是什么都可以算出来了。这个初始的数据51就被称为“随机数种子”,这一系列的516、1、66、951、616……数字被称为“随机数序列”。我们把51改成52,就会有这样的结果:
三、楼主好人,跪求种子
那么怎么可以使得每次运行程序的时候都生成不同的“随机数序列”呢?因为我们每次执行程序时候的时间很可能不一样,因此我们可以用当前时间做“随机数种子”。
MyRand rand = new MyRand(Environment.TickCount);
for (int i = 0; i < 10; i++)
{
Console.WriteLine(rand.Next());
}
Environment.TickCount为“系统启动后经过的毫秒数”。这样每次程序运行的时候Environment.TickCount都不大可能一样(靠手动谁能一毫秒内启动两次程序呢),所以每次生成的随机数就不一样了。
当然如果我们把new MyRand(Environment.TickCount)放到for循环中:
for (int i = 0; i < 100; i++)
{
MyRand rand = new MyRand(Environment.TickCount);
Console.WriteLine(rand.Next());
}
运行结果又变成“很多是连续”的了,原理很简单:由于for循环体执行很快,所以每次循环的时候Environment.TickCount很可能还和上次一样(两行简单的代码运行用不了一毫秒那么长事件),由于这次的“随机数种子”和上次的“随机数种子”一样,这样Next()生成的第一个“随机数”就一样了。从“-320”变成“-856”是因为运行到“-856”的时候时间过了一毫秒。