缺失值处理二
一: 删除法
对于缺失值,一般不会直接进行删除,因为删除过多影响数据分析,所以会对其进行第二中操作,补齐
二: 填补法( 一般适用于 元素 为 float 或者 int的数据)
1. 均值或 中位数 补齐法:
df.age ---查看age列
df.age.mean() ----查看年龄列平均值
df.age.fillna( df.age.mean() ) ----使用均值填补,即在缺失值位置 补上均值
df.age.median() _中位数的查看
df.age.fillna( df.age.median () )
2、众数填补法(适用于 字符型 数据)
df.gender ---- 查看性别
df.gender.fillna( df.gender.mode() ) ----查看性别列 -gender的众数
( 众数一般不止一个,通常选择第一个)
df.gender.fillna( df.gender.mode()[0]) ---使用第一个众数填补 缺失值