Python学习7 ----Pandas数据预处理实例

Pandas数据预处理实例

代码详见https://github.com/RenDong3/Python_Note

1实例背景

该实例使用数据为kaggle经典入门竞赛,泰坦尼克
比赛解析 https://github.com/apachecn/Interview/tree/master/docs/Kaggle/competitions/getting-started/titanic

2 Pandas数据预处理

2.1 读取数据

对于csv数据每一列代表的含义以及详细分析见比赛解析给的网址(在上面哦!!)
在这里插入图片描述

2.2 缺失值统计

观察发现,'Age’列含有大量缺失值,Nan即代表缺失值
在这里插入图片描述
在这里插入图片描述

2.3 平均值计算

如果不对缺失值做预处理,得到结果为nan
在这里插入图片描述
只对有效数据进行计算得到平均值
在这里插入图片描述
使用dropna()丢弃缺失值
在这里插入图片描述

3 列属性之间关联

一般使用pivot_table()得到index和values之间的关联
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4排序操作

对Age进行排序操作,但index不变化
在这里插入图片描述
在这里插入图片描述
对Age进行排序操作,同时index也按照顺序排序
在这里插入图片描述
在这里插入图片描述

5 自定义函数

使用apply()调用自定义函数
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值