缺失值填补
替换数据中的未知值。
输入
• 数据:输入数据集
• 学习器:用于填补的学习算法
输出
• 数据:包含填补后值的数据集
Orange 的某些算法和可视化工具无法处理数据中的未知值。此小部件执行统计学家称为“填补”的操作:用从数据计算出的值或用户设定的值替换缺失值。默认填补方法为 1-最近邻(1-NN)。

-
默认方法:在顶部框中,用户可为所有属性指定通用填补方法。
- 不填补:保留缺失值不变。
- 平均值/最常见值:对连续属性使用平均值,对离散属性使用最常出现的值。
- 设为独特值:将缺失值替换为新的独特标识(例如“未知”)。
- 基于模型的填补:通