Pandas 的数据框可以看作是 Numpy 中的二维数组。
1. DataFrame对象行操作
1) loc与iloc区别注意
行操作与 Numpy 二维数组的方法类似,特别要注意的是 loc 和 iloc 的区别。示例代码如下。
In [1]: import pandas as pd
In [2]: df = pd.DataFrame({'a': [1, 2, 3], 'b': ['a', 'b', 'c'],'c': ["A","B","C"]})
...: df
Out[2]:
a b c
0 1 a A
1 2 b B
2 3 c C
In [3]: df.loc[1,:] # 选择标签为1的行数据
Out[3]:
a 2
b b
c B
Name: 1, dtype: object
In [4]: df.loc[1:2,:] # 选择标签为1、2的行数据
Out[4]:
a b c
1 2 b B
2 3 c C
In [5]: df.iloc[1:2,:] # 注意当使用iloc时,只返回标签为1的行数据
Out[5]:
a b c
1 2 b B
2)DataFrame对象倒序操作
这里的倒序方法和 Python 中自带的 list 的索引方法相同,可以设置起始点和终止点以及步长。Python 的特点就是可以将步长设为-1,这样就是倒序的索引了。
In [6]: d