次序统计
x = np.array([[11, 12, 13, 14, 15],
[16, 17, 18, 19, 20],
[21, 22, 23, 24, 25],
[26, 27, 28, 29, 30],
[31, 32, 33, 34, 35]])
np.amin(x, axis=0)
[11 12 13 14 15]
x = np.array([[11, 12, 13, 14, 15],
[16, 17, 18, 19, 20],
[21, 22, 23, 24, 25],
[26, 27, 28, 29, 30],
[31, 32, 33, 34, 35]])
np.amax(x, axis=0)
[31 32 33 34 35]
- 求极差 np.ptp()
沿轴的值范围(最大值-最小值)
x = np.random.randint(0, 20, size=[4, 5])
[[ 0 13 10 17 7]
[10 0 12 1 9]
[18 19 1 2 12]
[ 7 2 10 0 9]]
np.ptp(x,axis=0)
18 19 11 17 5]
- 求分位数np.percentile(a,q)
返回数组元素的第q个百分位
q:位于0-100,用于计算是几分位参数
均值与方差
x = np.random.randint(0, 20, size=[4, 5])
[[ 0 13 10 17 7]
[10 0 12 1 9]
[18 19 1 2 12]
[ 7 2 10 0 9]]
np.median(x,axis=0)
[ 8.5 7.5 10. 1.5 9. ]
- 求平均值np.mean()
沿轴的元素的总和除以元素的数量
x = np.random.randint(0, 20, size=[4, 5])
[[19 6 8 9 8]
[13 12 7 19 6]
[13 12 17 2 11]
[ 5 0 12 16 9]]
np.mean(x,axis=0)
[12.5 7.5 11. 11.5 8.5]
- 求加权平均值
注:加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数
np.average(a,aixs=,weights=,returned=)
沿指定轴计算加权平均值
mean,average:计算均值的函数
在不赋予权重比时,二者一样。赋予后average可以计算加权平均值
未赋予时:
np.average(x,axis=0)
[12.5 7.5 11. 11.5 8.5]
赋予权重:
依据于数组本身,赋权重,不能超出
y = np.arange(1, 21).reshape([4, 5])
[[ 1 2 3 4 5]
[ 6 7 8 9 10]
[11 12 13 14 15]
[16 17 18 19 20]]
z = np.average(x, axis=0, weights=y)
[ 9.41176471 6.31578947 12.30952381 11.7173913 8.9 ]
- 求方差np.var(x)
沿指定轴计算方差
注:方差和样本方差的无偏估计,方差公式中分母上是n;样本方差则是分母上是n-1(n为样本个数)
ddof:自由度个数
np.var(x) 等价于 np.mean((x - np.mean(x)) ** 2)
25.860000000000003
np.var(x, ddof=1) 等价于 np.sum((x - np.mean(x)) ** 2) / (x.size - 1)
- 求标准差
一组数据平均值分散程度的一种度量,是方差的算术平方根
np.std(x) 等价于 np.sqrt(np.var(x))
5.0852728540364485