pandas的定义以及pandas的DataFrame的初步使用(二)

补充:
Series自动对齐
当多个series对象之间进行运算的时候,如果不同series之间具有不同的索引值,那么运算会自动对齐不同索引值的数据,如果某个series没有某个索引值,那么最终结果会赋值为NaN。
示例:
在这里插入图片描述

DataFrame对象的使用

1、DataFrame的创建
通过二维数组创建
在这里插入图片描述
通过字典创建
在这里插入图片描述
注意:不能将columns直接写道DataFrame()里面,否则会出现
在这里插入图片描述
2、索引对象
不管是Series还是DataFrame对象,都有索引对象。
索引对象负责管理轴标签和其它元数据(eg:轴名称等等)
通过索引可以从Series、DataFrame中获取值或者对某个索引值进行重新赋值
Series或者DataFrame的自动对齐功能是通过索引实现的
3、DataFrame数据获取
可以直接通过列索引获取指定列的数据, eg: df[column_name]
如果需要获取指定行的数据的话,需要通过ix方法来获取对应行索引的行数据,eg: df.ix[index_name]
在这里插入图片描述
4、通过行索引和列索引对数据进行修改或者铁添加在这里插入图片描述
5、pandas基本功能
数据文件读取/文本数据读取、 索引、选取和数据过滤、算法运算和数据对齐、函数的应用和映射、重置索引
6、pandas数据文件读取
通过pandas提供的read_xxx相关的函数可以读取文件中的数据,并形成DataFrame,常用的数据读取方法为:read_csv,主要可以读取文本类型的数据

读取csv文件
读取csv文件
读取txt文件
在这里插入图片描述

读取excel文件
在这里插入图片描述
7、pandas:数据过滤获取
通过DataFrame的相关方式可以获取对应的列或者数据形成一个新的DataFrame, 方便后续进行统计计算。

在这里插入图片描述
通过切片进行数据检索及删除有NaN的行
在这里插入图片描述
8、pandas缺省值NaN处理方法
对于DataFrame/Series中的NaN一般采取的方式为删除对应的列/行或者填充一个默认值

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
对NaN的表格进行填充,以0进行填充
在这里插入图片描述

对NaN表格的数据进行填充,以列进行填充。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
删除有NaN的行
删除全为NaN的行how =all
删除有NaN的列axis=1

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值