numpy常用的聚合函数
建立一个数组data,以data为例
1.求和 np.sum
data = np.random.randint(0, 100, size=5)
data.sum()
二维数组中sum应用
data = np.random.randint(0, 10, size=(3,2))
# 求整个数组的和
data.sum()
# 求每一行的和
data.sum(axis=0)
# 求每一列的和
data.sum(axis=1)
np.sum 和 np.nansum 的区别
sum数据中有空值,输出空值,
nansum数据中有空值,输出值
2.最大最小值np.max/ np.min
arr.max(), arr.min()
3.any() 和 all()
any 一个数组中,如果至少存在一个True, any函数就返回True
all 一个数组中,如果全都是True, all函数就返回True
4.乘积
np.prod()函数用来计算所有元素的乘积,对于有多个维度的数组可以指定轴,如axis=1指定计算每一行的乘积
5.平均值
np.mean()
6.标准差
np.std()
7.方差
np.var()
8.中位数
np.median()
9.在python中计算一个多维数组的任意百分比分位数,此处的百分位是从小到大排列,只需用np.percentile即可
np.percentile()
data = np.random.randint(0,100,size=100)
np.percentile(data,90)
#data中位于%90位置的数据