对于随机数的一些分析

7abebadb395f4aee96883eea1334f0ec.jpeg

多年前我朋友圈的一个朋友公司年会抽奖出现了下面的这样一幕:CTO现场review代码。本来带着一丝娱乐精神,结果被无限放大了。所以年会中大家都会很自然想review下代码。

2269aabc315a488f8c6f00a0cbc701e2.jpeg

比如这种姿势:

fbfc541e18da48d5a2b8d646c6c05f78.jpeg

然后就开始review代码。

8c64142e9f8b4798835caede6713a2e4.jpeg

我们就开几个脑洞,来从我的理解来说一下随机数的情况。

生成一个随机数看起来很简单,实则不易,怎么让一个确定的值得到一个不确定的值,这个想起来都有点困难,所以如果自己想实现,结果发现远比自己琢磨的要复杂的多,如果放眼程序领域,就拿Java来说,Java不同版本中对于随机算法的实现是有差别的。

比如Random的方法在JDK6中会使用System.nanoTime()的方式,而在早期的版本是使用currentTimeMillis,相比而言,nanoTime是以毫微秒为单位,而currentTimeMillis返回的是系统当前时间和1970-01-01之前间隔时间的毫秒数。

而且在随机算法的实现细节上,也有一些差别。

关于随机算法,还有一本书,这本书有400多页,涉及的面非常广。

f28d28fb39af418c8249f1224a254c21.jpeg

而如果我们不写SQL行不行,肯定可以,因为对于DBA来说,SQL能做任何想做的事情。

比如要得到一个随机数,写SQL其实有很多中写法。比如限定数据的范围是7~12,可以这样写。

mysql> SELECT FLOOR(7 + (RAND() * 6));

+-------------------------+

| FLOOR(7 + (RAND() * 6)) |

+-------------------------+

| 10 |

+-------------------------+

1 row in set

比如限定的数据范围是100以内,可以这样写。

mysql> select truncate(round(rand(),2)*100,0);

+---------------------------------+

| truncate(round(rand(),2)*100,0) |

+---------------------------------+

| 78 |

+---------------------------------+

当然这样只是最基本的实现,还没有考虑到种子函数的影响。

我们暂且抛开实现的复杂度,来看看结合一些场景的不同实现,我临时自造了几个概念,但是意思应该是相通的。

平均随机数

这是一种看起来随机,但是数据分布又可控的方式。

比如1~100我生成10个数字,我可以每10个数字分为1组。每组做一个随机。

这样我对1~10生成一个随机序列,比如第一个随机数是2,我就从20~29里面选择一个数字,下一数字是5,则从50~59里面选出1个数字。

bb2209242e05478b9c083649800be574.png

通过这种方式数据的分布方式决定是可控的,但是又保证了随机的特性。

一次性随机数

这类随机数就好比陕西的油泼面一样,简单快捷,一勺油即可搞定。如果我需要10个数字,那么我一次就生成10个随机数字。

看起来实现有些难,其实还好,使用rand()和limit即可。

插入8条数据。

mysql> insert into random values

(1),(2),(40),(30),(20),(9),(15),(21);

Query OK, 8 rows affected

Records: 8 Duplicates: 0 Warnings: 0

默认得到的数据是有序的。

mysql> select *from random;

+----+

| id |

+----+

| 1 |

| 2 |

| 40 |

| 30 |

| 20 |

| 9 |

| 15 |

| 21 |

+----+

8 rows in set

使用rand来得到一个随机序列。

mysql> select *from random order by rand();

+----+

| id |

+----+

| 1 |

| 2 |

| 30 |

| 20 |

| 40 |

| 21 |

| 15 |

| 9 |

+----+

8 rows in set

如果需要截取,就可以使用limit了。

mysql> select *from random order by rand() limit 4;

+----+

| id |

+----+

| 30 |

| 21 |

| 9 |

| 20 |

+----+

4 rows in set

动态随机数

这类随机数的代价最高,需要反复计算。总之不确定性要高很多,但是随机性更大。

比如对100个数中取出10个数,我们每取出一个数,就需要把它排除掉,从列表里重新再取,这样如果是连续的数字 1 2 3也是有可能的。

我们来通过SQL来简答模拟一下抽奖的过程。

初始化表数和数据。

create table lucky_money(id int primary key,money int,status smallint);

存储过程如下:

delimiter $$

create procedure proc_init ()

begin

declare

init_data integer default 1;

while init_data<=1500 do

insert into lucky_money values(init_data,0,0);

set init_data = init_data +1;

end while;

end $$

delimiter ;

call proc_init();

得到的数据是有序的。即员工号。

| 1497 | 0 | 0 |

| 1498 | 0 | 0 |

| 1499 | 0 | 0 |

| 1500 | 0 | 0 |

+------+-------+--------+

1500 rows in set

我们修改状态,随机得到一些数据的变化。

update lucky_money set money=1000,status=1 order by rand() limit 200;

update lucky_money set money=3000,status=1 where status=0 order by rand() limit 80;

update lucky_money set money=5000,status=1 where status=0 order by rand() limit 20;

所以第一轮之后,平均奖金是360元。

mysql> select avg(money) from lucky_money;

+------------+

| avg(money) |

+------------+

| 360.0000 |

+------------+

1 row in set

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/23718752/viewspace-2152327/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/23718752/viewspace-2152327/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值