一直对drop中axis取值代表的含义感到疑惑,网上有很多对axis取0或1时的解释,但都侧重于具体删除时的执行方向,按行删按列删,绕来绕去记了又忘。今天玩代码突然发现drop里axis取0或1其实是……先看例子:
df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["a", "b", "c", "d"])
>>> df
a b c d
0 1 1 1 1
1 2 2 2 2
2 3 3 3 3
首先,drop标签为a的一列,给它个axis=0,毫无悬念地报错了,看看出错的原因,“轴上不包含标签['a']”,也就是说代码运行时首先要在给定的0轴上找标签['a'],这当然找不到啦。
>>> df.drop('a',axis=0)
Traceback (most recent call last):
……
ValueError: labels ['a'] not contained in axis
既然这样,那我给它个在0轴上能找到的标签1:
>>> dff.drop(1,axis=0)
a b c d
0 1 1 1 1
2 3 3 3 3
drop成功!index为1的那一行被删掉了!再在axis=1方向上调戏它一下试试……果然不能在所选轴上找到标签[1]。
>>>dff.drop(1,axis=1)
Traceback (most recent call last):
……
ValueError: labels [1] not contained in axis
所以可以这么理解,设定axis是为了确定要删的标签是属于column还是index。这样是不是就好记多了。