[Pandas] 缺失值删除 df.dropna()

山茶花开时。

已于 2023-02-02 19:58:15 修改

阅读量7.3k

点赞数 12

分类专栏： Pandas 文章标签：数据分析 python pandas

于 2022-02-14 21:27:35 首次发布

本文链接：https://blog.csdn.net/Hudas/article/details/122924791

版权

Pandas 专栏收录该内容

56 篇文章

订阅专栏

该篇博客介绍了如何使用Pandas库中的dropna()方法来处理数据框中的缺失值。示例展示了删除包含缺失值的行和列，以及通过how、thresh参数进行更灵活的缺失值处理。同时，强调了dropna()操作不会直接修改原始数据，需要重新赋值或使用inplace=True来使更改生效。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

整行整列删除

使用df.dropna()方法删除缺失值

import pandas as pd
import numpy as np 

# 原数据
df = pd.DataFrame({'A':['a1','a1','a2','a2'],
                'B':['b1','b2',None,'b2'],
                'C':[1,2,3,4],
                'D':[5,6,None,8],
                'E':[5,None,7,8]
                 })

# 删除有缺失值的行
res1 = df.dropna()

# 删除有缺失值的列
res2 = df.dropna(1)

结果展示

res1

res2

以下是一些常见操作:

# 删除所有缺失值的行
df.dropna()

# 删除所有缺失值的列
df.dropna(axis = 'columns')
df.dropna(axis = 1)

# how参数 {'any', 'all'}, default 'any'，any: 删除带有nan的行; all: 删除全为nan的行
# 删除所有值都缺失的行
df.dropna(how = 'all')

# 删除至少有两个缺失值的行
df.dropna(thresh = 2)

# 指定判断缺失值的列范围
df.dropna(subset = ['B','D'])

# 使删除的结果生效
df.dropna(inplace = True)

# 指定列的缺失值删除
df.col.dropna()

需要注意的是，df.dropna()操作不能替换原来的数据。若需要替换，可以重新赋值或者传入参数inplace = True