这一部分主要内容有:
- 对数组缺失值的一些处理
- numpy.unique()函数
- 一些统计函数的使用
找出数组中的缺失值的总数以及所在的位置
首先创建一个含有缺失值的数组在进行处理:
a = np.random.rand(10, 10)
#首先创建数组
a[np.random.randint(10, size=5), np.random.randint(10, size=5)] = np.nan
#随机指定数组中的五个位置为缺失值
print('Array a:')
print(a)
print('Result:')
#计算缺失值的总数
print(np.isnan(a).sum())
#返回缺失值的位置
print(np.where(np.isnan(a)))
输出:
Array a:
[[0.31083684 0.91010211 0.04155175 0.39559228 0.5232661 0.55171089
0.38759503 0.18378685 0.10009486 0.52620333]
[0.0010178 0.94765918 0.51306455 0.48942569 0.90026993 0.14719501
0.93473118 0.13998178 0.14924952 0.39719853]
[0.40373739 0.57648616 0.83931134 0.59873777 0.18590857 0.32391626
0.38614168 0.9713498 nan 0.95889986]
[0.1717263 0.71885529 0.70497483 0.81978594 0.02236966 0.79265399
0.73746451 0.93370094 0.84984392 0.11840724]
[0.19580231 0.10