numpy.random包含多种概率分布的随机样本,是数据分析辅助的重点工具之一。
高斯分布(一般指正态分布)
np.random.normal(loc=0.0, scale=1.0, size=None)
samples = np.random.normal(size=(4,4))
samples2 = np.random.normal(size=(1,4))
print(samples)
print(samples2)
=================
[[ 0.35662443 1.60926491 -0.39375014 -1.51393004]
[ 0.32282414 -0.76187263 -0.5410377 1.51626327]
[-0.55840719 -0.75991083 0.08888547 0.6182852 ]
[-0.76060378 2.03292748 -1.50225913 0.86965216]]
[[ 0.28836116 -0.29002298 1.21264748 1.89623666]]
均匀分布
numpy.random.rand(d0, d1, …, dn):生成一个[0,1)之间的随机浮点数或N维浮点数组
import matplotlib.pyplot as plt
a = np.random.rand()
print(a,type(a)) # 生成一个随机浮点数
b = np.random.rand(4)
print(b,type(b)) # 生成形状为4的一维数组
c = np.random.rand(2,3)
print(c,type(c)) # 生成形状为2*3的二维数组,注意这里不是((2,3))
# 生成1000个均匀分布的样本值
samples1 = np.random.rand(1000)
samples2 = np.random.rand(1000)
plt.scatter(samples1,samples2)
===============
0.7273358073523575 <class 'float'>
[ 0.55028984 0.06438612 0.57857888 0.67743465] <class 'numpy.ndarray'>
[[ 0.54340321 0.71224107 0.75339886]
[ 0.07619281 0.50269827 0.72662153]] <class 'numpy.ndarray'>
正态分布
numpy.random.randn(d0, d1, …, dn):生成一个浮点数或N维浮点数组
samples1 = np.random.randn(1000)
samples2 = np.random.randn(1000)
plt.scatter(samples1,samples2)
# randn和rand的参数用法一样
numpy.random.randint(low, high=None, size=None, dtype=‘l’):生成一个整数或N维整数数组
若high不为None时,取[low,high)之间随机整数,否则取值[0,low)之间随机整数,且high必须大于low
print(np.random.randint(2))
# low=2:生成1个[0,2)之间随机整数
print(np.random.randint(2,size=5))
# low=2,size=5 :生成5个[0,2)之间随机整数
print(np.random.randint(2,6,size=5))
# low=2,high=6,size=5:生成5个[2,6)之间随机整数
print(np.random.randint(2,size=(2,3)))
# low=2,size=(2,3):生成一个2x3整数数组,取数范围:[0,2)随机整数
print(np.random.randint(2,6,(2,3)))
# low=2,high=6,size=(2,3):生成一个2*3整数数组,取值范围:[2,6)随机整数
=========================
1
[0 0 1 0 0]
[5 2 3 4 4]
[[0 1 1]
[1 1 1]]
[[5 4 5]
[5 3 5]]