loc是前后都包含的意思,而iloc是含前不含后。具体可从下面的实例中分辨。
代码如下:
import pandas as pd # 将pandas作为第三方库导入,为pandas取别名pd df=pd.DataFrame({"a":[1.7,1.8,2.8,2.7,5,], "b":[20.8,10,10,30,43,], "c":[23,15,50,3,33,],}) print(df) print('==========') d1 = df.loc[1:2] print(d1) print('==========') d2 = df.iloc[3:8] print(d2) print('==========') d3 = df.loc[3:8] print(d3) print('==========') d4 = df.iloc[4:10] print(d4)
运行结果如下:
D:\ProgramData\Anaconda3\python.exe "F:/7、定量应用 - 5.0版 2022.10.18/代码/test.py"
a b c
0 1.7 20.8 23
1 1.8 10.0 15
2 2.8 10.0 50
3 2.7 30.0 3
4 5.0 43.0 33
==========
a b c
1 1.8 10.0 15
2 2.8 10.0 50
==========
a b c
3 2.7 30.0 3
4 5.0 43.0 33
==========
a b c
3 2.7 30.0 3
4 5.0 43.0 33
==========
a b c
4 5.0 43.0 33
Process finished with exit code 0
从结果可以看到,loc是前后都包含的意思,而iloc是含前但不含后,类似 range() 函数。
另外,即使 dateframe.[a,b] 中的b超过了引用的dateframe的范围,也是不会报错的,系统会默认最后一个。