Python学习7 ----Pandas数据预处理实例

小熊猫Q

已于 2024-01-28 11:19:31 修改

阅读量4.2k

点赞数 6

文章标签： python pandas

于 2019-08-26 17:18:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29893385/article/details/100081419

版权

Pandas数据预处理实例

代码详见https://github.com/RenDong3/Python_Note

1实例背景

该实例使用数据为kaggle经典入门竞赛,泰坦尼克
比赛解析 https://github.com/apachecn/Interview/tree/master/docs/Kaggle/competitions/getting-started/titanic

2 Pandas数据预处理

2.1 读取数据

对于csv数据每一列代表的含义以及详细分析见比赛解析给的网址(在上面哦!!)
在这里插入图片描述

2.2 缺失值统计

观察发现,'Age’列含有大量缺失值,Nan即代表缺失值
在这里插入图片描述

2.3 平均值计算

如果不对缺失值做预处理,得到结果为nan
在这里插入图片描述
只对有效数据进行计算得到平均值

使用dropna()丢弃缺失值

3 列属性之间关联

一般使用pivot_table()得到index和values之间的关联
在这里插入图片描述

4排序操作

对Age进行排序操作,但index不变化
在这里插入图片描述

对Age进行排序操作,同时index也按照顺序排序

5 自定义函数

使用apply()调用自定义函数
在这里插入图片描述

关注

6
点赞
踩
71

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

小熊猫Q CSDN认证博客专家 CSDN认证企业博客

码龄9年

运维领域新星创作者

143: 原创

1万+: 周排名

2万+: 总排名

66万+: 访问

: 等级

5215: 积分

3288: 粉丝

1096: 获赞

100: 评论

3357: 收藏

私信

关注

分类专栏

最新评论

爆肝总结30道计网常考面试题
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)起一个更符合文章内容的标题；(2)提升标题与正文的相关性。
Python学习7 ----Pandas数据预处理实例
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
scikit-learn决策树算法使用
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
目标追踪笔记---帧差法
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Python enumerate() 函数
CSDN-Ada助手: Python 的类型标记有人用么，为什么不用呢？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。