import pandas as pd
import numpy as np
# 在数据分析中,数据缺省的情况经常出现,在Pandas 中以NaN表示数据缺省。
series = pd.Series([1, 2, 3, np.nan, 5])
print(series)
# Pandas提供了多种缺省值处理函数,可以通过 isnull()、notnull()来判断数据是否缺省,
# 这两个函数的返回值均为一个包含布尔值的对象,布尔值表示该元素是否为缺省。
# isnull()函数的返回值True 表示缺省值,False 表示非缺省值,notnull()函数则相反。
print(series.isnull())
print(series.notnull())
df = pd.DataFrame([[1, 2, 3], [4, np.nan, 6], [np.nan, 8, 9]])
print(df)
print(df.isnull())
print(df.notnull())
# 可通过 dropna()方法丢弃包含缺省值的行或列,默认丢弃含有缺省值的行,也可通过指定参数只丢弃全为缺省值的行或列:
# 丢弃包含缺省值的行
print(df.dropna())
# 丢弃所有字段均为缺省值的行
print(df.dropna(how='all'))
# 对缺省值进行填充处理
print(df.fillna(0))
pandas缺省值处理
最新推荐文章于 2023-03-04 17:24:38 发布
本文介绍了在Pandas中如何处理数据缺失值。通过使用isnull()和notnull()函数来判断数据是否存在缺失,并利用dropna()方法丢弃含有缺失值的行或列。此外,还展示了fillna()函数用于填充缺失值,确保数据的完整性和准确性。
摘要由CSDN通过智能技术生成