Pandas库围绕Series类型和DataFrame类型这两种数据结构,提供了一种高效便捷的数据处理方式。
一、DataFrame类概述
1、Series是pandas库的一维数据类型,DateFrame是pandas库的二维数据类型。
2、DateFrame既有行索引,也有列索引:
1)行索引:默认是0,1,2,3。。。,可以通过column参数修改默认行索引名称,也可以通过可以通过字典的Key指定行索引name,如果通过ndarray、list、Series等创建则无法指定行索引名称
2)列索引:默认是0,1,2,3。。。,可以通过index参数修改默认列索引名称
3、3个重要的属性
index:行索引
columns:列索引
values:值的二维数组
二、创建DataFrame
方式 | 方法 |
---|---|
1.通过一维的ndarray、列表创建 | print(x1) |
2.通过字典创建 | print(x) |
3.通过pandas库的Series类实例创建 | print(x3) |
4.通过DataFrame类实例创建 | |
三、DataFrame读写文件
常用的读写方法如下:
方法名称 | 返回值类型 | 参数详解 | 备注 | |
---|---|---|---|---|
读 | read_csv | DataFrame对象 | 不能读取加密的 | |
read_excel | DataFrame对象 | 不能读取加密的excel | ||
写 | to_csv | |||
to_excel |
参考文章: