搜索微信公众号:‘AI-ming3526’或者’计算机视觉这件小事’ 获取更多AI干货
csdn:https://blog.csdn.net/abcgkj
github:https://github.com/aimi-cn/AILearners
1.为什么要设计axis?
numpy是个多维数组,多维数组运算需要指定到底对哪一维操作,因此axis就是用来指定需要操作的维数。
2.二维数组示例
>>> import numpy as np
>>> np_data = np.random.randint(1,8,[3,4])
>>> np_data
array([[2, 2, 1, 7],
[6, 3, 1, 5],
[5, 2, 5, 1]])
假设 这个数组代表了样本数据的特征,其中每一行代表一个样本的4个特征,每一列是不同样本的特征。如果在分析样本的过程中需要对每个样本的4个特征求和,该如何处理?
>>> np.sum(np_data, axis=1)
array([12, 15, 13])
那如果想求每种特征的最小值,该如何处理?
>>> np.min(np_data, axis=0)
array([2, 2, 1, 1])
又如果想得知所有样本所有特征的平均值呢?
>>> np.average(np_data)
3.3333333333333335
由此可以看出:**通过不同的axis,numpy会沿着不同的方向进行操作:如果不设置,那么对所有的元素操作;如果axis=0,则沿着纵轴进行操作;axis=1,则沿着横轴进行操作。**但这只是简单的二位数组,如果是多维的呢?可以总结为一句话:**设axis=i,则numpy沿着第i个下标变化的方向进行操作。**例如刚刚的例子,可以将表示为:
data =[[a00, a01],
[a10, a11]]
所以axis=0时,沿着第0个下标变化的方向进行操作,也就是a00->a10, a01->a11,也就是纵坐标的方向,axis=1时也类似。
3.多维数组
对多维数组进行编码:
如三维数组b(2,3,3):
[[[a000, a001, a002],
[a010, a011, a012],
[a020, a021, a022]],
[[a100, a101, a102],
[a110, a111, a112],
[a120, a121, a122]]]
# 对b数组进行 axis=0上的求和,
np.sum(b, axis=0)
# 简单可以理解为对第一个数字不一样,其它两个数字都一样的元素进行求和,即:
[[a000+a100 , a001+a101, a002+a102],
[a010+a110, a011+a111, a012+a112],
[a020+a120, a021+a121, a022+a122]]
# 对于b数组进行axis=1上的求和,
np.sum(b, axis=1)
# 简单可以理解为对第二个数字不一样,其它两个数字都一样的元素进行求和,即:
[[a000+a010+a020, a001+a011+a021, a002+a012+a022],
[a100+a110+a120, a101+a111+a121, a102+a112+a122]]
#对b数组进行 axis=2上的求和,
np.sum(b, axis=2)
# 简单可以理解为对第三个数字不一样,其它两个数字都一样的元素进行求和,即:
[[a000+a001+a002, a010+a011+a012, a020+a021+a022],
[a100+a101+a102, a110+a111+a112, a120+a121+a122]]
总而言之,设axis=i,则numpy沿着第i个下标变化的方向进行操作。简单来说,就是:如果对第i维进行操作,只需保证第i个数字不同,对其余数字相同的元素进行操作。
4.多维数组示例
import numpy as np
b = [[[4,4,4],
[2, 2, 2],
[2, 1, 3]],
[[2, 0, 2],
[0, 0, 4],
[1, 2, 0]]]
print("对axis=0上的元素进行求和:")
print(np.sum(b, axis=0))
print("对axis=1上的元素进行求和:")
print(np.sum(b, axis=1))
print("对axis=2上的元素进行求和:")
print(np.sum(b, axis=2))
输出:
对axis=0上的元素进行求和:
[[6 4 6]
[2 2 6]
[3 3 3]]
对axis=1上的元素进行求和:
[[8 7 9]
[3 2 6]]
对axis=2上的元素进行求和:
[[12 6 6]
[ 4 4 3]]
5.更多
在numpy中,使用的axis的地方非常多,处理上文已经提到的average、max、min、sum,比较常见的还有sort和prod,更多关于numpy库的使用,可以参考:
NumPy 教程
Numpy中文文档
NumPy v1.17.dev0手册
本文是笔者的一些粗略见解,如理解有误,欢迎各路大佬指正交流。