java中random方法取值范围_Java中的random函数是如何实现的

在Java中调用这个Math.Random()函数能够返回带正号的double值,取值范围是[0.0,1.0)的左闭右开区间,返回值是一个伪随机选择的数,在该范围内(近似)均匀分布。

1. random()函数的使用

Java的API中是这样描述Random()函数的:

伪随机,也就是有规则的随机,所谓有规则的就是在给定种(seed)的区间内随机生成数字。

相同种子数的Random对象,相同次数生成的随机数字是完全相同的。

Random类中各方法生成的随机数字都是均匀分布的,也就是说区间内部的数字生成的几率均等。

下面是Java.util.Random()方法摘要

protected int next(int bits):生成下一个伪随机数。

boolean nextBoolean():返回下一个伪随机数,它是取自此随机数生成器序列的均匀分布的boolean值。

void nextBytes(byte[] bytes):生成随机字节并将其置于用户提供的 byte 数组中。

double nextDouble():返回下一个伪随机数,它是取自此随机数生成器序列的、在0.0和1.0之间均匀分布的 double值。

float nextFloat():返回下一个伪随机数,它是取自此随机数生成器序列的、在0.0和1.0之间均匀分布float值。

double nextGaussian():返回下一个伪随机数,它是取自此随机数生成器序列的、呈高斯(“正态”)分布的double值,其平均值是0.0标准差是1.0。

int nextInt():返回下一个伪随机数,它是此随机数生成器的序列中均匀分布的 int 值。

int nextInt(int n):返回一个伪随机数,它是取自此随机数生成器序列的、在(包括和指定值(不包括)之间均匀分布的int值。

long nextLong():返回下一个伪随机数,它是取自此随机数生成器序列的均匀分布的 long 值。

void setSeed(long seed):使用单个 long 种子设置此随机数生成器的种子。

方法摘要也就这些,下面给几个例子:

1.生成[0,1.0)区间的小数:double d1 = r.nextDouble();

2.生成[0,5.0)区间的小数:double d2 = r.nextDouble() * 5;

3.生成[1,2.5)区间的小数:double d3 = r.nextDouble() * 1.5 + 1;

4.生成-231到231-1之间的整数:int n = r.nextInt();

5.生成[0,10)区间的整数:

int n2 = r.nextInt(10);//方法一

n2 = Math.abs(r.nextInt() % 10);//方法二

2. random()函数的实现

2.1 线性同余方程

Java中的Random类生成的是伪随机数,使用的是48-bit的种子,然后调用一个linear congruential formula线性同余方程

那么什么是线性同余方程呢?

古老的LCG(linear congruential generator)代表了最好最朴素的伪随机数产生器算法。主要原因是容易理解,容易实现,而且速度快。

LCG 算法数学上基于公式:

X(n+1) = (a * X(n) + c) % m

其中,各系数为:

模m, m > 0

系数a, 0 

增量c, 0 <= c 

原始值(种子) 0 <= X(0) 

其中参数c, m, a比较敏感,或者说直接影响了伪随机数产生的质量。

一般而言,高LCG的m是2的指数次幂(一般2^32或者2^64,Java中是2^48),因为这样取模操作截断最右的32或64位就可以了。多数编译器的库中使用了该理论实现其伪随机数发生器random()。

2.2 Java中的random()实现

刚刚说了,Java调用了一个线性同余方程来实现伪随机数的产生,具体的计算如下:

Xi = (Xi-1 * A + C ) mod M

其中A,C,M都是常数(一般会取质数)。当C=0时,叫做乘同余法。引出一个概念叫seed,它会被作为X0被代入上式中,然后每次调用random()函数都会用上一次产生的随机值来生成新的随机值。可以看出实际上用random()函数生成的是一个递推的序列,一切值都来源于最初的 seed。所以当初始的seed取一样的时候,得到的序列都相同。

下面Random()的两种构造方法

Random():创建一个新的随机数生成器。

Random(long seed):使用单个 long 种子创建一个新的随机数生成器。

我们在构造Random对象的时候指定种子,如果是第一种构造方法,则默认当前系统时间对应的相对时间有关的数字作为种子数

需要说明的是:你在创建一个Random对象的时候可以给定任意一个合法的种子数,种子数只是随机算法的起源数字,和生成的随机数的区间没有任何关系。

public Random() {

this(seedUniquifier() ^ System.nanoTime());

}

private static long seedUniquifier() {

// L'Ecuyer, "Tables of Linear Congruential Generators of

// Different Sizes and Good Lattice Structure", 1999

for (;;) {

long current = seedUniquifier.get();

long next = current * 181783497276652981L;

if (seedUniquifier.compareAndSet(current, next))

return next;

}

}

这里使用了System.nanoTime()方法来得到一个纳秒级的时间量,参与48位种子(为什么要48位)的构成,然后还进行了一个很变态的运算——不断乘以181783497276652981L,直到某一次相乘前后结果相同(似乎不是相同,但是其doc文档是这样说明的,如果有清楚的朋友可以下面留言说明)——来进一步增大随机性,这里的nanotime可以算是一个真随机数,不过有必要提的是,nanoTime和我们常用的currenttime方法不同,返回的不是从1970年1月1日到现在的时间,而是一个随机的数——只用来前后比较计算一个时间段,比如一行代码的运行时间,数据库导入的时间等,而不能用来计算今天是哪一天。

到目前为止,这个程序已经至少进行了三次随机:

1、获得一个长整形数作为“初始种子”(系统默认的是8682522807148012L(

2、不断与181783497276652981L相乘,直到某一次相乘前后数值相等

3、与系统随机出来的nanotime值作异或运算,得到最终的种子

protected int next(int bits) {

long oldseed, nextseed;

AtomicLong seed = this.seed;

do {

oldseed = seed.get();

nextseed = (oldseed * multiplier + addend) & mask;

} while (!seed.compareAndSet(oldseed, nextseed));

return (int)(nextseed >>> (48 - bits));

} next()函数是random()的核心函数,也是对线性同余的实现。

(oldseed * multiplier + addend) & mask; 是不是形如

(Xi-1 * A + C ) mod M?只是mod变成了&,为什么呢?

private static final long multiplier = 0x5DEECE66DL;

private static final long addend = 0xBL;

private static final long mask = (1L << 48) - 1; 其中multiplier和addend分别代表公式中的a和c,很好理解,但mask代表什么呢?其实,x & [(1L << 48)–1]与 x(mod 2^48)等价。解释如下:

而我们将x对2^N取余操作希望达到的目的可以理解为:

1、所有比2^N位(包括2^N那一位)高的位全都为0

2、所有比2^N低的位保持原样

所以x & [(1L << 48)–1]与 x(mod 2^48)等价。

接着让我们看看nextInt()的实现。

public int nextInt() {

return next(32);

} 默认调用next,生成32位的随机数。

public int nextInt(int n) {

if (n <= 0)

throw new IllegalArgumentException("n must be positive");

if ((n & -n) == n) // i.e., n is a power of 2

return (int)((n * (long)next(31)) >> 31);

int bits, val;

do {

bits = next(31);

val = bits % n;

} while (bits - val + (n-1) < 0);

return val;

} 显然,这里基本的思路还是一样的,先调用next函数生成一个31位的随机数(int类型的范围),再对参数n进行判断,如果n恰好为2的方幂,那么直接移位就可以得到想要的结果;如果不是2的方幂,那么就关于n取余,最终使结果在[0,n)范围内。另外,do-while语句的目的应该是防止结果为负数。

那么为什么(n & -n) == n可以判断一个数是不是2的次方幂?

众所周知,计算机中负数使用补码储存的:

2 :0000 0010      -2 :1111 1110

8 :0000 1000      -8 :1111 1000

18 :0001 0010     -18 :1110 1110

20 :0001 0100     -20 :1110 1100 补码有一个特性,就是可以对于两个相反数n与-n,有且只有最低一个为1的位数字相同且都为1,而更低的位全为0,更高的位各不相同。因此两数作按位与操作后只有一位为1,而能满足这个结果仍为n的只能是原本就只有一位是1的数,也就是恰好是2的次方幂的数了。

Reference:

1. http://blog.sina.com.cn/s/blog_93dc666c0101h3gd.html

2. http://www.cnblogs.com/xkfz007/archive/2012/03/27/2420154.html

3. http://t1174779123.iteye.com/blog/2037719

4. http://www.importnew.com/12460.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值