视频链接:https://www.bilibili.com/video/BV1W14y1Y7Sw
局部离群因子(Local Outlier Factor,LOF)算法
o3与C1、C2两类都距离很远,所以是全局离群点。
o1看上去合群,但距离C1 、C2都比较远,因此o1是局部离群点。
基于距离的异常值识别技术不能识别出o1,所以改用基于密度的异常值识别技术,例如LOF。
LOF是无监督的异常检测技术,它为每个点分配一个LOF分数。将该分数与 设定的阈值相比较可以判断是异常值还是非异常值。
介绍6个术语。
比较LOF 分数和阈值,当LOF分数大于阈值是,为离群点。
算法步骤总结:按公式依次计算,得到最终需要的LOF score,与threshold比较大小。