使用pandas过程中,常用到切片操作,比如df.loc[],df.iloc[]。这两个方法的细节或区别主要在两个点:
- loc[]方法针对显性的行列索引,iloc[]方法针对的是隐性的行列索引
import pandas as pd
import numpy as np
df=pd.DataFrame(np.random.randn(3,4),columns=list('abcd'))
#获取第二列数据
df.loc[:,2] #错,直接这样写会报错
df.loc[:,'b'] #对,使用loc可以使用显性列名索引
df.iloc[:,2] #对,使用iloc可以使用隐性索引
- loc[]方法切片操作,切片范围是包含左边又包含右边,是闭区间,而iloc[]方法执行切片操作时,切片范围和python切片范围一致,包含左边但不包含右边,是左闭右开
import pandas as pd
import numpy as np
df=pd.DataFrame(np.random.randn(3,4),columns=list('abcd'))
df
#结果包含'd'列,范围是[0:3]列,'d'列隐性列索引是3
df.loc[:,:'d']
#结果不包含'd'列,范围是[0:3)列
df.iloc[:,:3]