一、创建DataFrame
- 从列表创建
- 从数组创建
- 从字典创建
字典的键作为dataframe的列索引,行索引默认为数字,从0开始。
如果字典里有多个值是列表,则每一个列表的长度必须相等,如果有单个元素作为值,则会自动填充到与列表相同的长度。
- 自定义指定DataFrame的索引
index 指定行索引
columns 指定列索引
创建时间序列,使用时间序列作为索引
pd.date_range(‘20190722’, periods=3)
20190722 是序列开始时间
periods 是序列长度
二、查看DataFrame信息
以如下dataframe为例
查看行索引
查看列索引
查看每一列的数据类型
查看详细信息
DataFrame取数据
测试数据
按索引取
取某一列
取某一行
高级索引
格式:dataframe.loc[ 行索引 , 列索引 ]
在高级索引 loc 中遵循的是左闭右闭的原则,按索引取值
1、取第一列和第三列
2、取第一列到第三列(左闭右闭)
3、只取某一列
4、取第一行
4、取不连续多行(第一行,第三行)
取多行的时候返回DataFrame
5、取连续多行(第一行到第四行)
6、行和列同时操作
位置索引
格式: DataFrame.iloc[ 行下标 :列下标 ]
与高级索引的使用基本相同,唯一要注意的就是下标是左闭右开的