离群值检测
离群值检测小部件。
输入
- 数据:输入数据集
输出
- 离群值:被标记为离群值的实例
- 非离群值:未被标记为离群值的实例
- 数据:附加了“离群值”变量的输入数据集
该小部件支持以下四种离群值检测方法。所有方法均基于分类算法:
- 单类支持向量机(One-class SVM,使用非线性核函数 RBF):适用于非高斯分布的数据。
- 协方差估计器(Covariance Estimator):仅适用于高斯分布数据。
- 局部离群因子(Local Outlier Factor, LOF):通过计算局部密度偏差检测离群值,适用于中高维数据集。
- 孤立森林(Isolation Forest):通过随机选择特征和分割值来孤立异常点,适用于高维数据。