DataFrame的基础概念
data 有点类似Excel表格的东西, 他的每一行被称为一个Record, 每一列称为Series
创建方法
data = pd.DataFrame(data, index, columns, dtype, copy)
data 为一个二维的数组, 如ndarray, list, dict, map, series)
index 为每行的索引名称,与行数一一对应,否则报错
columns 为每一列的名称,与之对应,否则报错
dtype 指定数据类型
copy 是否拷贝数据
创建代码
data = np.arange(20).reshape(4,5)
arr = pd.DataFrame(data, index = list('1234'), columns = list('ABCDE'))
操作方法 (loc, iloc)
- loc 通过名称操作
arr.loc
arr.loc["1":"3", "A":"C"]
范围操作
- iloc 通过行下标数操作
arr.iloc[0]
arr.iloc[0:3, 3:4]
4是开区间,不包含于第四列
总结:
Ioc 是通过行和列的名称操作
iloc 是通过列数和行数的下标进行操作