在数据分析中,随机数不仅有利于数据分析,而且在机器学习方面随机数的使用也是机器学习算法配置和评估的重要部分。例如,神经网络中的权重的随机初始化和将数据分成随机的训练和测试集等。因此,生成随机数是数据分析中一项很重要的技术。
在 Python 中,可以通过 Python 中的 random 模块生成随机数,但是,其效率要远低于利用 NumPy 中的 random 模块生成随机数。numpy.random 模块提供了非常全的自动产生数据的 API,通过该模块中的函数可以很方便地生成随机数。下面介绍使用 numpy.random 模块中的函数生成随机数的常用方法。
使用 rand() 函数
rand() 函数的格式如下:
numpy.random.rand(d0,d1, …,dn)
该函数的作用是生成一个 (d0,d1, …,dn) 维的数组,数组的元素取自 [0, 1) 内均匀分布的随机数,但数组的元素不包括 1。若没有参数输入,则生成一个数。括号里面的参数是指定产生数组的形状。
randn() 函数
randn() 函数的格式如下:
numpy.random.randn(d0,d1, …,dn)
该函数的作用是生成一个 (d0,d1, …,dn) 维的数组,数组的元素是标准正态分布随机数。若没有参数输入,则生成一个数。括号里面的参数是指定产生数组的形状。
randint() 函数
randint() 函数的格式如下:
numpy.random.randint(low, hig