可以参考:https://blog.csdn.net/weixin_35757704/article/details/89280715
查看缺失值
可以通过下面的代码得到缺失值的数量:
dataframe.isnull().sum()
也可通过简单的 .info() 来看缺失值的情况;
下面的代码可以得到 dataframe的缺失值占比情况:为0就表示没有缺失值
dataframe.isnull().sum()/len(dataframe)
缺失值在进行求和时,会被默认视为0
确定值填充
使用 0 填充缺失值:
dataframe.fillna(0,inplace=True)
也经常用这一列的平均值填充:
dataframe.fillna(dataframe.mean(),inplace=True)
参考当前列其他值填充
dataframe.fillna(method='pad',inplace=True) #参考前面值
dataframe.fillna(method='bfill',inplace=True) #参考后面值
删除行
dataframe.dropna(axis = 0,inplace=True)
这个可以直接删除有缺失值的行。
如果把axis=1,则会删除列,不建议这样做,除非这个维度的缺失值非常严重。
如果希望整行都缺失才删除,可以使用:
dataframe.dropna(axis=0, how='all', inplace=True)