学习笔记
1.可以查看缺失信息
df.info( )
2.挑选所有非缺失值列
问题与联系
1.【问题一】 如何删除缺失值占比超过25%的列?
答:可以计算每列缺失值占该列总数的比例,
df.isna().sum( )/len(df[colnums])
【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计?
目前还没看完,后期再修改
【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?
答:可以先了解缺失值的分布情况、缺失比例,缺失太高可以舍弃整条数据;以及了解数据的含义,采取合理的方法进行填充,有很多缺失值的填充方法,要结合特征的含义,选取合理的值进行填充