- 基本思想都是利用一个算法给出某个点的离群点得分,根据阈值找到离群点
- 分类
- 基于方法的分类
- 基于模型的技术
- 比如我们的数据是一个高斯分布,那么一个对象不能很好地拟合这个分布,就会被认为是一个异常点
- 基于邻近度的技术
- 通常在对象之间定义邻近性度量,并且许多异常检测方法都基于邻近度。
- 异常对象是远离大部分其他对象的点。
- 通常在对象之间定义邻近性度量,并且许多异常检测方法都基于邻近度。
- 基于密度的技术
- 对象的密度估计可以相对直接地计算,特别是当对象之间存在邻近度度量时,低密度区域中的对象相对远离近邻。
- 比如温度10,20,30,40,突然一个操作选择了100,那么从密度来看可能就会被检测出来
- 基于模型的技术
- 基于人参与的程度
- 监督的异常检测
- 需要异常类和正常类的训练集
- 可能要采取crowdsource或者自己标注了,人力成本比较高
- 但是会更加准确
- 需要异常类和正常类的训练集
- 非监督的异常检测
- 许多实际情况下,没有提供类标号,那么我们要自动分配类标记
- 典型的,聚类
- 许多实际情况下,没有提供类标号,那么我们要自动分配类标记
- 半监督的异常检测
- 有时,训练数据包含被标记的
- 监督的异常检测
- 基于方法的分类
异常检测的方法整理
最新推荐文章于 2022-07-18 20:13:41 发布