今天,我又不得不拿起我的秘籍接着学习新的东西,才刚刚看完书本文章,敲了一下代码,在理解中,后续,会再更新缺失值处理的知识,先完成发文任务。
老规矩,上代码:
运行结果:
通过运行,结果,我们可以知道我们先用np.nan生成了两个缺失值,然后再用df.isnull()显示缺失值的对应的真值,返回bool值(布尔值),最后,用df.dropna()
将有缺失值对应的行删除。
**df.fillna(method=‘backfill’)**用后面的值来替换缺失值
df.fillna(method=‘bfill’,limit=1)也是用后面的值来替换缺失值。同df.fillna(method=‘backfill’)
**df.fillna(method=‘pad’)**用前面的值来替换缺失值。
**df.fillna(0)**用0来替换缺失值。
**df.fillna(df.mean()[‘col2’:‘col4’])**将对应的列下的缺失值进行替换。
**df.fillna(df.mean()[‘col2’:‘col4’])**用对应列的平均值来替换。
最后,感谢大家前来观看鄙人的文章,不胜感激,文中或有诸多不妥之处,还望海涵和指出。