小编典典
pd.DataFrame.loc可以使用一两个索引器。在其余文章中,我将第一个索引器表示为i,将第二个索引器表示为j。
如果仅提供一个索引器,则该索引器将应用于数据帧的索引,并且假定缺少的索引器代表所有列。因此,以下两个
示例是等效的。
df.loc[i]
df.loc[i, :]
其中:用来表示所有列。
如果同时存在两个索引器,则i引用索引值和j引用列值。
现在我们可以专注于什么类型的值i,并j可以承担。让我们以以下数据框df为例:
df = pd.DataFrame([[1, 2], [3, 4]], index=['A', 'B'], columns=['X', 'Y'])
loc 已经写成这样i并且j可以是
scalars 应该是各个索引对象中的值
df.loc['A', 'Y']
arrays 其元素也是相应索引对象的成员(请注意,我传递给的数组的顺序loc受尊重
df.loc[['B', 'A'], 'X']
B 3
A 1
Name: X, dtype: int64
* 传递数组时,请注意返回对象的维数。`i`是上面的数组,`loc`返回一个对象,其中返回带有这些值的索引。在这种情况下,因为j是标量,所以`loc`返回了一个`pd.Series`对象。如果我们为i和传递了一个数组,我们可以操纵它以返回一个数据帧jÿ