漫谈随机:如何均匀生成随机数

从一个具体的例子说起:如何均匀生成 1 亿以内的随机数? 所谓“均匀”,意味着生成概率相等。

从 rand() 函数开始

生成随机数,第一反应是使用 rand() 函数rand() 函数是 C 语言中用来生成随机数的函数:

#include <stdlib.h>

void srand(unsigned int seed);
int rand(void);
int rand_r(unsigned int *seedp);

rand() 函数可以随机生成 [0, RAND_MAX] 之间的数字。RAND_MAX 一般是 2147483647

传统的 rand() 函数使用前需要使用 srand() 函数设置随机种子。由于 rand() 函数内部使用了静态变量保存状态,调用 rand() 函数时会进行加锁,并且是不可重入的。rand_r() 是 rand() 的可重入版本,其使用参数 seedp 来保存相应的状态。

为了生成 1 亿以内的随机数,最简单的方式是取模:rand() % 100000000 。

但是很可惜,这样子做是不对的。因为这样做对于 [0, 99999999] 这 1 亿个数字来说,概率是不相等的。比如,随机生成数字 0 的情况有 22 种可能;但是随机生成数字 99999999 的情况只有 21 种。

C++ 的 uniform_int_distribution

从 C++11 开始,标准库提供了 std::uniform_int_distribution 用于均匀地生成某个范围内的随机整数。(也提供了 std::uniform_real_distribution 用于生成某个范围内的随机浮点数。)

int main()
{
    std::random_device rd;
    std::mt19937 gen(rd());
    std::uniform_int_distribution<int32_t> distrib(0, 99999999);
    for (uint32_t i = 0; i < 10; i++)
    {
        std::cout << distrib(gen) << std::endl;
    }
}

关于 std::random_device 和 std::mt19937

std::mt19937 是 C++ 标准库提供的基于梅森旋转(Mersenne Twister)算法的伪随机数生成器,可以快速产生高质量的伪随机数,修正了古典随机数发生算法的很多缺陷。 std::mt19937 生成的是 uint32_t 的随机数,它还有另外一个孪生版本 std::mt19937_64 用于生成 uint64_t 的随机数。

std::random_device 是 C++ 标准库提供的 "真"随机数生成器,具体实现与平台有关。在 Linux 上,比较简单的实现是可以从 /dev/random 读取。一般情况下,std::random_device 每次生成随机数都需要消耗“熵池”中的熵,速度较慢,且当墒池中的墒耗尽时可能发生阻塞,所以不适合用于快速生成伪随机数序列,而适合用于作为伪随机数生成器的种子。

除了 std::mt19937 / std::mt19937_64,C++ 标准库还提供了:

  • 基于线性同余(Linear Congruential)的伪随机数生成器 std::minstd_rand。通过线性同余方法构建的伪随机数生成器比较“脆弱”,其内部状态可以轻易地由其输出演算得知。
  • 基于带进位减法(Subtract-With-Carry)的伪随机数生成器 std::ranlux24_base 和 std::ranlux48_base ,分别生成 uint32_t 和 uint64_t 的随机数。带进位减法是一种时滞斐波那契伪随机数生成器,用于改进标准的线性同余生成器。

随机数生成器的 benchmark

总的来说,无论是性能还是随机数的质量,std::mt19937 / std::mt19937_64 都是其中出类拔萃的伪随机数生成器。

小结

  1. 虽然 rand() 取模的方式造成的随机数不均匀概率不算特别大,但具体影响因应用而异,建议尽量避免使用这种方式。
  2. 使用 rand() 的时候,比较方便的是使用 time(nullptr) 作为随机种子,但是会有一些问题:
    1. 一方面 time(nullptr) 一秒钟才变化一次,作为随机种子变化频率太低。
    2. 另一方面 time(nullptr) 不够随机,很容易被预测。
  3. rand() 内部会加锁,可以使用 rand_r() 避免;但是总体来说,写 C++ 代码,建议不要使用 rand() 系列的函数。
  4. std::random_device 生成随机种子;std::mt19937 / std::mt19937_64 生成随机数;std::uniform_int_distribution 生成某个范围的随机数。我认为是一个方便又安全的随机数生成组合。

漫谈随机:如何均匀生成随机数 - 知乎 (zhihu.com)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
⼯业⼤数据漫谈19:⼯业⼤数据数据采集常见的⼯业协议简介 (下) 4、ProfiBus ProfiBus是德国标准(DIN19245)和欧洲标准(EN50170)的现场总线标准。由PROFIBUS--DP、PROFIBUS-FMS、PROFIBUS -PA系列组成。DP⽤于分散外设间⾼速数据传输,适⽤于加⼯⾃动化领域。FMS适⽤于纺织、楼宇⾃动化、可编程控制器、低压开关等。 PA⽤于过程⾃动化的总线类型,服从IEC1158-2标准。PROFIBUS是⼀种⽤于⼯⼚⾃动化车间级监控和现场设备层数据通信与控制的现 场总线技术。可实现现场设备层到车间级监控的分散式数字控制和现场通信⽹络,从⽽为实现⼯⼚综合⾃动化和现场设备智能化提供了可⾏ 的解决⽅案。该标准⼴泛适⽤于制造业⾃动化、流程⼯业⾃动化和楼宇、交通电⼒等其他领域⾃动化。 5、ModBus Modbus是由Modicon(现为施耐德电⽓公司的⼀个品牌)在1979年发明的,是全球第⼀个真正⽤于⼯业现场的总线协议。 ModBus⽹络是⼀个⼯业通信系统,由带智能终端的可编程序控制器和计算机通过公⽤线路或局部专⽤线路连接⽽成。其系统结构既包括硬 件、亦包括软件。它可应⽤于各种数据采集和过程监控。 ModBus⽹络只有⼀个主机,所有通信都由他发出。⽹络可⽀持247个之多的远程从属控制器,但实际所⽀持的从机数要由所⽤通信设备决 定。采⽤这个系统,各PC可以和中⼼主机交换信息⽽不影响各PC执⾏本⾝的控制任务。 Modbus协议是应⽤于电⼦控制器上的⼀种通⽤语⾔。通过此协议,控制器相互之间、控制器经由⽹络(例如以太⽹)和其它设备之间可以 通信。它已经成为⼀通⽤⼯业标准。有了它,不同⼚商⽣产的控制设备可以连成⼯业⽹络,进⾏集中监控。此协议定义了⼀个控制器能认识 使⽤的消息结构,⽽不管它们是经过何种⽹络进⾏通信的。它描述了⼀控制器请求访问其它设备的过程,如何回应来⾃其它设备的请求,以 及怎样侦测错误并记录。它制定了消息域格局和内容的公共格式。 Modbus是通讯协议,⽽RS232、RS485只能代表通讯的物理介质层和链路层。Modbus协议⽀持传统的RS-232、RS-422、RS-485 和以太⽹设备。许多⼯业设备,包括PLC,DCS,智能仪表等都在使⽤Modbus协议作为他们之间的通讯标准。 6、OPC OPC全称是Object Linking and Embedding(OLE) for Process Control,它的出现为基于Windows的应⽤程序和现场过程控制应⽤ 建⽴了桥梁。在过去,为了存取现场设备的数据信息,每⼀个应⽤软件开发商都需要编写专⽤的接⼝函数。由于现场设备的种类繁多,且产 品的不断升级,往往给⽤户和软件开发商带来了巨⼤的⼯作负担。通常这样也不能满⾜⼯作的实际需要,系统集成商和开发商急切需要⼀种 具有⾼效性、可靠性、开放性、可互操作性的即插即⽤的设备驱动程序。在这种情况下,OPC标准应运⽽⽣。OPC标准以微软公司的OLE 技术为基础,它的制定是通过提供⼀套标准的OLE/COM接⼝完成的,在OPC技术中使⽤的是OLE 2技术,OLE标准允许多台微机之间交 换⽂档、图形等对象。 ⼤致上可以这样理解,RS232、RS485是硬件接⼝技术,CAN、ProBus等是现场总线技术,ModBus是⼯业控制协议,OPC是⽹络数据 接⼝。 当然,⼯业协议⾮常多,光是常见的现场总线就有⼆⼗多种,这些只能在⼯作中遇到之后再慢慢学习了。
Java安全漫谈是一本关于Java安全的书籍,深入探讨了Java应用程序在网络环境中的安全性和相关的安全漏洞。该书内容涵盖了Java安全基础、Java虚拟机的安全机制、Java安全管理、Java安全开发等方面的知识。 首先,Java安全基础部分介绍了Java安全模型的原理和特点,包括Java类库的安全特性、权限管理和访问控制、安全策略配置等。这部分内容可帮助开发人员了解Java应用程序的安全需求,并提供相应的解决方案。 其次,Java虚拟机的安全机制是Java应用程序的基石。该书介绍了Java虚拟机的安全沙箱和类加载机制,并讨论了如何利用这些安全机制避免恶意代码的执行和隐患的防范。 此外,Java安全管理部分从用户角度出发,介绍了Java应用程序的安全管理工具和技术,如Java安全策略文件、权限管理和安全认证等。开发人员可以通过合理配置和使用这些工具来提高Java应用程序的安全性。 最后,该书还涉及了Java安全开发过程中的一些最佳实践和常见安全漏洞,如输入验证、跨站脚本攻击(XSS)、SQL注入、跨站请求伪造(CSRF)等。通过学习和掌握这些知识,开发人员可以编写出更加安全的Java应用程序。 总而言之,Java安全漫谈是一本全面讨论Java安全的书籍,内容涵盖了Java安全基础、Java虚拟机的安全机制、Java安全管理和Java安全开发等方面的知识。它对于开发人员和安全从业人员来说,都是一本重要的参考书,有助于提高Java应用程序的安全性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值