为什么要设计axis这个东西呢?
numpy是个多维数组,多维数组运算需要指定到底对哪一维操作,因此axis就是用来指定需要操作的维数。
简单示例
先来看看一个二维数组
假设 这个数组代表了样本数据的特征,其中每一行代表一个样本的三个特征,每一列是不同样本的特征。如果在分析样本的过程中需要对每个样本的三个特征求和,该如何处理?
那如果想求每种特征的最小值,该如何处理?
重点
由此可以看出:(划重点)通过不同的axis,numpy会沿着不同的方向进行操作:如果不设置,那么对所有的元素操作;如果axis=0,则沿着纵轴进行操作;axis=1,则沿着横轴进行操作。但这只是简单的二位数组,如果是多维的呢?可以总结为一句话:设axis=i,则numpy沿着第i个下标变化的方向进行操作。例如刚刚的例子,可以将表示为:
所以axis=0时,沿着第0个下标变化的方向进行操作,也就是a00->a10, a01->a11,也就是纵坐标的方向,axis=1时也类似。
多维数组验证
下面我们举一个四维的求sum的例子来验证一下:
当axis=0时,numpy验证第0维的方向来求和,也就是第一个元素值=D0000+D1000+D2000+D3000=3+0+2+1=6,第二个元素=D0001+D1001+D2001+D3001=5+5+4+3=17,同理可得最后的结果如下:
当axis=3时,numpy验证第3维的方向来求和,也就是第一个元素值=D0000+D0001+D0002+D0003=3+5+5+0=13,第二个元素=D0010+D0011+D0012+D0013=0+1+2+4=7,同理可得最后的结果如下:
使用axis的相关函数
在numpy中,使用的axis的地方非常多,处理上文已经提到的average、max、min、sum,比较常见的还有sort和prod,下面分别举几个例子看一下:
sort
prod(即product,乘积)
简要概括axis的用法是:假设axis = i,则numpy沿着第 i 个下标变化的方向进行操作