综述
在python中,有 .argmax() 和 .idxmax() 两个函数,前者用于Series中,后者用于DataFrame中。
用法举例
举例如下:
import pandas as pd
import numpy as np
data = pd.DataFrame(np.arange(16).reshape(4, 4), columns=['A', 'B', 'C', 'D'])
# 查看DataFrame数据
print(data)
a = data.idxmin()
print(a)
得到结果:
A B C D
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
3 12 13 14 15
A 0
B 0
C 0
D 0
dtype: int64
由此可见,.idxmin()返回的是DataFrame中每一列最小值的索引,例如像上面的例子中,每一列最小值分别为“1”, “2”, “3”, “4”,它们在行坐标上的索引都是0,所以得到如此结果。
同样地,在Series中,argmin()也是同样的效果,举例如下:
series = np.array([[1, 2, 3, 4, 5], [6, 4, 3, 2, 1]])
print(series)
a = series.argmax()
print(a)
其结果为:
[[1 2 3 4 5]
[6 4 3 2 1]]
5
这是因为argmax()的运行步骤是先将Series中所有数排成一行,然后输出其中最大值的索引。
axis参数
如果想对DataFrame或Series中的每一列或每一行求最值的索引,可以使用axis参数。
- axis = 0:对每一列求最值
- axis = 1:对每一行求最值
举例为下:
import pandas as pd
import numpy as np
data = pd.DataFrame(np.arange(16).reshape(4, 4), columns=['A', 'B', 'C', 'D'])
# 查看DataFrame数据
print(data)
a = data.idxmin(axis=0)
print(a)
b = data.idxmin(axis=1)
print(b)
结果为:
A B C D
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
3 12 13 14 15
A 0
B 0
C 0
D 0
dtype: int64
0 A
1 A
2 A
3 A
dtype: object
series = np.array([[1, 2, 3, 4, 5], [6, 4, 3, 2, 1]])
print(series)
a = series.argmax(axis=0)
print(a)
b = series.argmax(axis=1)
print(b)
结果为:
[[1 2 3 4 5]
[6 4 3 2 1]]
[1 1 0 0 0]
[4 0]