多重插补 均值插补_Feature Engineering Part-1均值/中位数插补。

本文介绍了在数据预处理中,如何使用多重插补和均值插补方法来处理缺失值。通过这两种技术,可以有效地填补数据集中的空缺,以确保后续分析的准确性和完整性。内容涵盖了这两种插补方法的基本概念和实现过程。
摘要由CSDN通过智能技术生成

多重插补 均值插补

Understanding the Mean /Median Imputation and Implementation using feature-engine….!

了解使用特征引擎的均值/中位数插补和实现…。!

均值或中位数插补: (Mean or Median Imputation:)

The mean or median value should be calculated only in the train set and used to replace NA in both train and test sets. To avoid over-fitting

平均值或中位数应仅在训练集中进行计算,并用于代替训练和测试集中的NA。 避免过度拟合

均值/中位数插补:定义: (Mean / Median imputation: definition:)

Mean/median imputation consists of replacing all occurrences of missing values (NA) within a variable by the mean or median.

均值/中位数推算包括用均值或中位数替换变量中所有缺失值(NA)的出现。

我可以使用均值/中位数插补估算哪些变量? (Which variables can I impute with Mean / Median Imputation?)

· The mean and median can only be calculated on numerical variables, therefore, these methods are suitable for continuous and discrete numerical variables only.

·平均值和中位数只能通过数值变量来计算,因此,这些方法仅适用于连续和离散数值变量。

Image for post
Mean/Median Imputation
均值/中位数插补

假设: (Assumptions:)<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值