import pandas as pd
import numpy as np
# 建立了一个6X4的矩阵数据并且把两个位置置为空
dates = pd.date_range('20130101', periods=6)
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index=dates, columns=['A', 'B', 'C', 'D'])
df.iloc[0, 1] = np.nan
df.iloc[1, 2] = np.nan
print(df)
# 如果想直接去掉有 NaN 的行或列, 可以使用 dropna
df2 = df.dropna(axis=0, # 0: 对行进行操作; 1: 对列进行操作
how='any' # 'any': 只要存在 NaN 就 drop 掉; 'all': 必须全部是 NaN 才 drop
)
# 如果是将 NaN 的值用其他值代替, 比如代替成 0:pd.fillna()
df2 = df.fillna(value=0)
# 判断是否有缺失数据 NaN, 为 True 表示缺失数据:
df2 = df.isnull()
# 检测在数据中是否存在 NaN, 如果存在就返回 True:
df2 = np.any(df.isnull())==True
print(df2)
pandas处理丢失数据
最新推荐文章于 2022-04-21 11:00:04 发布