转自:https://blog.csdn.net/qq_21840201/article/details/80725433
### 随机生DataFrame 类型数据
import pandas as pd
import numpy as np
frame = pd.DataFrame(np.random.rand(4,4),index=list('abcd'),columns=list('ABCD'))
frame
ABCD
a0.5600940.3526860.9541000.926277
b0.5637280.3355170.2329020.973932
c0.4821550.9766180.5654620.445108
d0.4771460.9333530.2917640.986668
1、loc 基于行标签和列标签(x_label、y_label)进行索引
### .loc先行后列,中间用逗号(,)分割,例如取 a 和 A 对应的数据
frame.loc['a','A']
0.56009394013943303
### 取前两行对应数据
frame.loc['a':'b',:]
ABCD
a0.5600940.3526860.9541000.926277
b0.5637280.3355170.2329020.973932
### 取前两列对应数据
frame.loc[:,'A':'B']
AB
a0.5600940.352686
b0.5637280.335517
c0.4821550.976618
d0.4771460.933353
### 取前两行和前两列对应数据
frame.loc['a':'b','A':'B']
AB
a0.5600940.352686
b0.5637280.335517
### 上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,则
frame.loc[['a','d'],['A','D']]
上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,则
frame.loc[['a','d'],['A','D']]
AD
a0.5600940.926277
d0.4771460.986668
2、 iloc 基于行索引和列索引(index,columns) 都是从 0 开始
如果数据的行标签和列标签名字太长或不容易记,则用 iloc 很方便,只需记标签对应的索引即可
### .loc先行后列,中间用逗号(,)分割,例如取 a 和 A 对应的数据
frame.iloc[0,0]
0.56009394013943303
### 取前两行对应数据
frame.iloc[0:2,:]
ABCD
a0.5600940.3526860.9541000.926277
b0.5637280.3355170.2329020.973932
### 取前两列对应数据
frame.iloc[:,0:2]
AB
a0.5600940.352686
b0.5637280.335517
c0.4821550.976618
d0.4771460.933353
### 取前两行和前两列对应数据
frame.iloc[0:2,0:2]
AB
a0.5600940.352686
b0.5637280.335517
### 上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,则
frame.iloc[[0,3],[0,3]]
上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,则
frame.iloc[[0,3],[0,3]]
AD
a0.5600940.926277
d0.4771460.986668
3、 ix 基于标签或者索引(loc和iloc 的混合)
### 取前两行和前两列对应数据
frame.iloc[0:2,0:2]
AB
a0.5600940.352686
b0.5637280.335517
### 取前两行和前两列对应数据
frame.ix['a':'b','A':'B']
AB
a0.5600940.352686
b0.5637280.335517
官方文档新的python版本已经弃用 ix,建议使用 loc 和 iloc
.ix is deprecated. Please use
.loc for label based indexing or
---------------------
作者:求知者_123