Pandas系列学习教程——06 pandas处理缺失值

Sigmo Chicago

已于 2024-03-17 22:14:29 修改

阅读量1.3k

点赞数 37

分类专栏： Pandas数据分析文章标签： pandas 数据分析大数据 python conda

于 2024-03-11 00:01:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzylzy66/article/details/136611610

版权

Pandas数据分析专栏收录该内容

19 篇文章 2 订阅

订阅专栏

系列文章目录

第一章 Pandas 学习入门之pandas数据读取

第二章 Pandas 学习入门之pandas数据结构

第三章 Pandas 学习入门之pandas数据查询

第四章 Pandas 学习入门之pandas新增数据列

第五章 Pandas 学习入门之pandas数据统计函数

第六章 Pandas 学习入门之pandas处理缺失值

随着人工智能的不断发展，数据分析这门技术也越来越重要，很多人都开启了学习数据分析，本文就介绍了pandas学习的基础内容。本章简单介绍了pandas处理缺失值的步骤，详细请看下文。

系列文章目录

一、pandas缺失值处理相关函数

二、实例展示——特殊Excel的读取、清洗、处理

1.读取excel的时候，忽略前几个空行

3.删除掉全是空值的列

4.删除掉全是空值的行

5.将分数列为空的填充为0分

6.将姓名的缺失值填充

7.将清洗好的excel保存

前言

本章仅仅简单介绍了pandas数据统计函数的3种方法——汇总类统计、唯一去重和按值计数、相关系数与协方差。

提示：以下是本篇文章正文内容，下面案例可供参考

一、pandas缺失值处理相关函数

Pandas使用这些函数处理缺失值：

isnull和notnull：检测是否是空值，可用于df和series
dropna：丢弃、删除缺失值
axis : 删除行还是列，{0 or ‘index’, 1 or ‘columns’}, default 0
how : 如果等于any则任何值为空都删除，如果等于all则所有值都为空才删除
inplace : 如果为True则修改当前df，否则返回新的df
fillna：填充空值
value：用于填充的值，可以是单个值，或者字典（key是列名，value是值）
method : 等于ffill使用前一个不为空的值填充forword fill；等于bfill使用后一个不为空的值填充backword fill
axis : 按行还是列填充，{0 or ‘index’, 1 or ‘columns’}
inplace : 如果为True则修改当前df，否则返回新的df

二、实例展示——特殊Excel的读取、清洗、处理

0.引入库

代码如下（示例）：

import pandas as pd

1.读取excel的时候，忽略前几个空行

skiprows=2参数告诉pandas在读取数据之前跳过前两行。

这对于忽略文件中的标题或其他非数据信息非常有用。

studf = pd.read_excel("./student_excel.xlsx", skiprows=2)
studf

2.检测空值

studf.isnull()

studf["分数"].isnull()

studf["分数"].notnull()

# 筛选没有空分数的所有行
studf.loc[studf["分数"].notnull(), :]

3.删除掉全是空值的列

studf.dropna(axis="columns", how='all', inplace=True)
studf

4.删除掉全是空值的行

studf.dropna(axis="index", how='all', inplace=True)
studf

5.将分数列为空的填充为0分

studf.fillna({"分数":0})

# 等同于
studf.loc[:, '分数'] = studf['分数'].fillna(0)
studf

6.将姓名的缺失值填充

使用前面的有效值填充，用ffill：forward fill

studf.loc[:, '姓名'] = studf['姓名'].fillna(method="ffill")
studf

method : 等于ffill使用前一个不为空的值填充forword fill；等于bfill使用后一个不为空的值填充backword fill

7.将清洗好的excel保存

studf.to_excel("student_excel_clean.xlsx", index=False)

总结

提示：这里对文章进行总结：

随着人工智能的不断发展，数据分析这门技术也越来越重要，很多人都开启了学习数据分析，本文就介绍了pandas学习的基础内容。本章简单介绍了pandas处理缺失值的步骤，详细请阅览上文。

关注

37
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
Pandas系列学习教程——06 pandas处理缺失值

随着人工智能的不断发展，数据分析这门技术也越来越重要，很多人都开启了学习数据分析，本文就介绍了pandas学习的基础内容。本章简单介绍了pandas处理缺失值的步骤，详细请看下文。
复制链接

扫一扫

专栏目录

Sigmo Chicago CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

39万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

664: 积分

336: 粉丝

446: 获赞

13: 评论

374: 收藏

私信

关注

热门文章

分类专栏

Pandas数据分析 19篇
Excel数据分析 1篇

最新评论

Pandas系列学习教程——19 pandas快捷方便的处理日期数据
CSDN-Ada助手: 恭喜作者第19篇博客的问世！您对Pandas系列学习教程的坚持与付出让读者受益匪浅。希望您能继续分享更多关于Pandas的知识，也可以考虑探讨如何利用Pandas处理不同类型的数据或者与其他库的结合应用，让读者能够更全面地掌握数据处理的技巧。期待您的下一篇作品！祝创作顺利！
Excel数据分析系列课程——01 系统认识数据分析框架
CSDN-Ada助手: 恭喜用户完成了第20篇博客！Excel数据分析系列课程的第一篇文章“系统认识数据分析框架”肯定会对读者有很大的帮助。希望用户能够继续坚持创作，分享更多关于数据分析的知识和经验。下一步可以考虑深入介绍数据分析工具或者实际案例分析，让读者能够更加全面地了解数据分析的应用。期待用户的下一篇作品！
Pandas系列学习教程——16 pandas数据转换函数map、apply、applymap
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题为“Pandas系列学习教程——pandas数据转换函数map、apply、applymap”，内容一定十分有用和详尽。希望您能继续坚持创作，让更多人受益于您的知识分享。下一步，或许您可以考虑深入探讨一些高级应用或者与其他数据处理工具的结合，继续拓展读者的视野。期待您的下一篇作品！
Pandas系列学习教程——17 pandas对每个分组应用apply函数
CSDN-Ada助手: 恭喜您在Pandas系列学习教程中写下了第17篇博客！持续创作是非常了不起的事情，我真的很期待您的下一篇文章。或许您可以考虑分享一些高级应用技巧或者与其他数据处理工具的对比分析，这样可以让读者更全面地了解Pandas的应用场景。希望您能继续保持创作的热情，为大家带来更多有价值的内容！
Pandas系列学习教程——18 pandas通过stack和pivot实现数据透视
CSDN-Ada助手: 恭喜你发布了第18篇博客！看到你不断学习并分享Pandas系列教程，真的很令人钦佩。希望你可以继续保持热情，继续分享更多关于数据处理的知识，也许可以尝试探讨一些高级应用或者与其他数据处理工具的结合，以丰富读者的学习体验。加油！期待你的下一篇作品。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。