缺失值补充--SimpleImputer

最新推荐文章于 2024-04-16 21:28:26 发布

夺笋123

最新推荐文章于 2024-04-16 21:28:26 发布

阅读量915

点赞数

分类专栏： # sklearn机器学习库文章标签： python 人工智能 sklearn

本文链接：https://blog.csdn.net/m0_54510474/article/details/128032519

版权

sklearn机器学习库专栏收录该内容

20 篇文章 14 订阅

订阅专栏

SimpleImputer是sklearn库中的一个实用工具，用于处理数据集中缺失值的问题。它可以按照平均值、中位数、最频繁值或指定常数值来填充缺失数据。此方法适用于数值型和类别型数据，且提供了是否复制输入数据的选项。在处理数据预处理时，SimpleImputer能够有效地改善数据质量，为后续的模型训练做好准备。

摘要由CSDN通过智能技术生成

SimpleImputer

sklearn.impute.SimpleImputer(*, missing_values=nan, strategy='mean', fill_value=None, verbose='deprecated', copy=True, add_indicator=False)

通过简单的方法对缺失值进行补充

沿着每一列通过给定的策略（均值、中位数、众数）或定值对缺失值进行补充

参数

missing_values

int, float, str, np.nan, None or pandas.NA, default=np.nan
缺失值的占位符，数据中所有的值为missing_values的空缺值将会被填充

strategy

str, default=’mean’

缺失值填补策略	填补缺失值的数值
mean	每一列的均值
median	每一列的中位数（只能用于数值型数据）
most_frequent	每一列的众数（可用于数值型或字符串型数据）
constant	给定值`fill_value`

fill_value

str or numerical value, default=None
当参数strategy='constant'时，将使用fill_value替换所有缺失值
当该参数为default时，填补缺失值的时候，对于数值型数据将填补为0，对于字符串型或对象型数据将被填补为‘missing_value’