1. Numpy随机数
numpy.random
包含多种概率分布的随机样本,是数据分析辅助的重点工具之一,可以理解为直接将random库封装在里面了
1.1 np.random.normal():
标准正态分布 —— 随机生成期望值为0,标准差为1的数据
samples = np.random.normal(size=(4,4))
print(samples)
–> 输出的结果为:(每次运行的结果是不一样的)
[[ 0.17875618 -1.19367146 -1.29127688 1.11541622]
[ 1.48126355 -0.81119863 -0.94187702 -0.13203948]
[ 0.11418808 -2.34415548 0.17391121 1.4822019 ]
[ 0.46157021 0.43227682 0.58489093 0.74553395]]
1.2 numpy.random.rand():
均匀分布 —— 随机生成一个[0,1)之间的浮点数或N维浮点数组
a = np.random.rand()
print(a,type(a)) # 生成一个随机浮点数
b = np.random.rand(4)
print(b,type(b)) # 生成形状为4的一维数组
c = np.random.rand(2,3)
print(c,type(c)) # 生成形状为2*3的二维数组,注意这里不是((2,3))
–> 输出的结果为:
0.3671245126484347 <class 'float'>
[ 0.95365841 0.45627035 0.71528562 0.98488116] <class 'numpy.ndarray'>
[[ 0.82284657 0.95853197 0.87376954]
[ 0.53341526 0.17313861 0.18831533]] <class 'numpy.ndarray'>
1.3 numpy.random.randn():
正态分布 —— 生成一个浮点数或N维浮点数组
samples1 = np.random.randn(10)
print(samples1)
samples2 = np.random.randn(2,5)
print(samples2)
–> 输出的结果为:
[-1.07341567 -0.6601267 -0.19374853 1.44820858 0.26453877 -0.4937472
-0.82022635 -0.62650093 1.19518224 1.19693846]
[[-0.61614341 0.74219791 -0.10559783 0.13597484 0.67165899]
[ 0.76474081 -0.89700563 -0.38994125 -0.23313716 -0.44029526]]
1.4 ★★★★★ numpy.random.randint(low, high=None, size=None, dtype='l'):
生成一个整数或N维整数数组
若high
不为None
时,取[low,high)
之间随机整数,否则取值[0,low)
之间随机整数,且high
必须大于low
dtype
参数:只能是int类型
print(np.random.randint(2))
# low=2:生成1个[0,2)之间随机整数
print(np.random.randint(2,size=5))
# low=2,size=5 :生成5个[0,2)之间随机整数
print(np.random.randint(2,6,size=5))
# low=2,high=6,size=5:生成5个[2,6)之间随机整数
print(np.random.randint(2,size=(2,3)))
# low=2,size=(2,3):生成一个2x3整数数组,取数范围:[0,2)随机整数
print(np.random.randint(2,6,(2,3)))
# low=2,high=6,size=(2,3):生成一个2*3整数数组,取值范围:[2,6)随机整数
–> 输出的结果为:
1
[1 0 0 1 1]
[5 2 5 5 2]
[[1 1 0]
[1 1 0]]
[[4 4 3]
[2 5 3]]
2. Numpy数据的输入输出
2.1 存储数组数据 .npy文件
np.save()
存储文件
ar = np.random.rand(5,5)
print(ar)
np.save('D:/arraydata.npy', ar)
–> 输出的结果为:
[[0.87254906 0.00726477 0.37502478 0.64723601 0.10740997]
[0.54276754 0.82614351 0.70233536 0.51561633 0.78215584]
[0.58463386 0.23444911 0.39902693 0.77578908 0.34745686]
[0.43733726 0.64815567 0.62844921 0.07246289 0.29193098]
[0.44410149 0.89325329 0.76075618 0.6014087 0.98217215]]
2.2 读取数组数据 .npy文件
np.load()
读取文件
ar_load =np.load('D:/arraydata.npy')
print(ar_load)
–> 输出的结果为:
[[0.87254906 0.00726477 0.37502478 0.64723601 0.10740997]
[0.54276754 0.82614351 0.70233536 0.51561633 0.78215584]
[0.58463386 0.23444911 0.39902693 0.77578908 0.34745686]
[0.43733726 0.64815567 0.62844921 0.07246289 0.29193098]
[0.44410149 0.89325329 0.76075618 0.6014087 0.98217215]]
2.3 存储/读取文本文件
np.savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='\n', header='', footer='', comments='# '):
存储为文本txt文件
fmt='%.18e'
默认输出格式,可进行修改
delimiter=' '
默认空格分隔
ar = np.random.rand(5,5)
np.savetxt('array.txt',ar, delimiter=',')
ar_loadtxt = np.loadtxt('array.txt', delimiter=',')
print(ar_loadtxt)
–> 输出的结果为:
系统输出窗口:
[[0.27809561 0.13099526 0.41413755 0.24738731 0.96509306]
[0.52061013 0.46544273 0.48742147 0.65186243 0.06035009]
[0.84144618 0.18436624 0.57374973 0.82352666 0.17068944]
[0.65558846 0.28659065 0.3509751 0.14739354 0.33983354]
[0.26037459 0.76700635 0.13992939 0.86856601 0.91177684]]
如果这里不希望输出的时候是科学计数法,想要以保留两位小数的方式保存数据,代码如下:
ar = np.random.rand(5,5)
np.savetxt('array.txt',ar,fmt='%.2f',delimiter=',')
ar_loadtxt = np.loadtxt('array.txt', delimiter=',')
print(ar_loadtxt)
–> 输出的结果为:
系统输出窗口:
[[0.11 0.58 0.84 0.33 0.06]
[0.46 0.43 0.95 0.03 0.25]
[0.65 0.55 0.55 0.63 0.8 ]
[0.51 0.38 0.98 0.73 0.98]
[0.15 0.34 0.11 0.6 0.77]]