转自:Python中axis=0或者axis=1到底该怎么用? - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/110105054
目录
1.当调用df.sum(axis=1),我得到了按行计算的和,不信你看:
2.当调用df.dropna(axis=1,how='any'),我得到了删除一列后的数据,你敢信?!
概括地讲,axis=0和1具体含义如下:
axis=0表示跨行地执行当前操作,axis=1表示跨列地执行当前操作
0.引言
使用pandas的时候,会经常在各种方法中看到axis参数;比如以下两个axis=1操作竟然直观上相互矛盾,1中是按“行”操作的,而2中确实按“列”操作的,这给我们造成了疑惑:
1.当调用df.sum(axis=1),我得到了按行计算的和,不信你看:
2.当调用df.dropna(axis=1,how='any'),我得到了删除一列后的数据,你敢信?!
这,,,,发生了什么???
之前一直被这个问题搞得欲仙欲死,每次用的时候沉思良久,不得其意,我也不知道我是怎么用到现在的,,,,
3.问题解决
首先,经过翻阅资料,我查到了以下类似官方的解释:
Pandas保持了Numpy对关键字axis的用法,那么Numpy是怎么解释的呢:
"轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴沿着列的方向水平延伸。”
看了上面这段话,我依然不是十分的理解(我语文水平不高,是真的)
于是我继续寻找资料,终于让我找到了一篇能够让我看了就懂的相关解释:
“axis=0表示跨行,axis=1表示跨列,作为方法动作的副词”
注意,注意,注意:“作为方法动作的副词”(重要的事情说三遍!!!)
所以,我这样理解了我前面试验的那两个小栗子:df.sum(axis=1)代表沿着列水平方向计算均值(跨列)(沿着列标签横向执行sum方法);df.dropna( axis=1,how='any') 代表将列标签们中含有nan的列沿着水平的方向依次删掉(沿着列标签方向执行dropna方法)