缺失值的常用处理方式:
1.对包含缺失值的列和行数据进行删除
df.dropna()
2.对缺失值数据进行所在列的中位数、众数、平均值等进行填充
#对所有列的缺失值数据进行平均值填充
df.fillna(df.mean())
#对指定列的缺失值进行平均值填充
df.fillna(df["指定列索引"].mean())
3.对缺失值周围的数据进行模型训练,然后通过模型对缺失值进行填充
缺失值的常用处理方式:
1.对包含缺失值的列和行数据进行删除
df.dropna()
2.对缺失值数据进行所在列的中位数、众数、平均值等进行填充
#对所有列的缺失值数据进行平均值填充
df.fillna(df.mean())
#对指定列的缺失值进行平均值填充
df.fillna(df["指定列索引"].mean())
3.对缺失值周围的数据进行模型训练,然后通过模型对缺失值进行填充