7.pandas缺失值处理（表格数据处理）

最新推荐文章于 2024-04-16 21:41:51 发布

CSDN专家-微编程

最新推荐文章于 2024-04-16 21:41:51 发布

阅读量645

点赞数 1

分类专栏： Pandas专栏文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/technologist_28/article/details/126333967

版权

18 篇文章 2 订阅

订阅专栏

在这里插入图片描述
案例：对特殊的Excel的读取，清洗，处理

import pandas as pd
#skiprows=2，跳过前两行
studf = pd.read_excel("../data/stu.xlsx",skiprows=2)
print(studf)

在这里插入图片描述

print(studf.isnull())
# print(studf['分数'].isnull())
# print(studf['分数'].isnull())
# 筛选没有空分数的所有行
# print(studf.loc[studf['分数'].notnull(),:])

在这里插入图片描述

# 如果列都是空，则删除掉，how匹配所有，inplace=True代表直接修改
studf.dropna(axis="columns", how='all', inplace=True)
print(studf)

## 3.删除掉全部是空值的列

studf.dropna(axis="index", how='all', inplace=True)
print(studf)

在这里插入图片描述

studf = studf.fillna({"分数": 0})
# 等同于
# studf.loc[:, '分数'] = studf['分数'].fillna(0)
print(studf)

在这里插入图片描述

使用前面有效值填充，用ffill:forward fill

studf.loc[:, '姓名'] = studf['姓名'].fillna(method='ffill')
print(studf)

在这里插入图片描述

studf.to_excel("../data/stu_clean.xlsx", index=False)

最后结果
在这里插入图片描述

关注

专栏目录