异常检测算法分类总结

最新推荐文章于 2024-05-30 10:21:50 发布

kakarotte99

最新推荐文章于 2024-05-30 10:21:50 发布

阅读量2.1k

点赞数 2

分类专栏：机器学习基础知识文章标签：异常检测

本文链接：https://blog.csdn.net/weixin_42433740/article/details/103462219

版权

在选择算法之前，重要的是考虑数据源的性质和质量，数据是否收到异常污染将会影响检测方法。如果训练数据不包含异常（或标记了异常以便删除），我们称该任务为新奇检测，否则，我们称该任务为离群点检测。
异常检测的算法分类：

一、预测（监督机器学习）

利用过去的无异常的干净数据训练模型，并测量当前观察值与预测值的差异。确切的说，该类异常检测的算法应称为新奇检测。

我们也可以通过人为的定义一个统计值，并设定一个阈值，在阈值范围外的为异常值。如：超过移动平均值两个标准差的点，即为异常值。

单类支持向量机：利用不包含异常的干净数据集训练模型，创建决策边界，用于分类未来的输入数据点。由于标准的支持向量机实现中对于训练数据集中的离群值适用性比较低，故更适应新奇检测。
隔离森林：类似于随机森林，该算法通过迭代训练集中的数据点来训练模型，随机选择一个特征，并在最大值和最小值直接随机选择一个分割点，通过判断数据点在整体森林中的路径长度来确定是否异常，异常值具有更短的路径。考虑到异常点的阈值受到数据中污染比例的影响，故污染比例设为

关注