基于最近邻的异常检测 (2)——LOF方法

Local Outlier Factor(LOF)是一种Density-based方法,用于局部异常检测。它通过计算目标的局部可达密度和邻域内目标的平均密度率来描述相对密度,从而识别局部异常。LOF算法优于Distance-based方法在于它可以捕捉局部异常,但实际应用中可能效果稍逊,并且时间复杂度较高。
摘要由CSDN通过智能技术生成

前面提到,Distance-based算法在全局语境(全局数据)下的异常检测表现良好,那么Distance-based算法是否有能力在局部环境下对目标进行建模吗?

事实上,Distance-based算法只能刻画目标的k邻近绝对密度,无法对相对密度(相对于局部数据)建模。值得注意的是,现实中不同的上下文语境下,目标的含义可能截然不同。举个例子,普通人的平均智商是90~110(全局),所以一个智商120的人可以称为“天才”,但是对一群智商140以上的人(局部)中只能是普通人,异常检测同样存在这样的现象,即局部异常和全局异常。从下图可以很好的描述:

                                                              

对于C1中的目标和C2的局部异常值p2,采用Distance-based算法无法进行识别。主要原因是算法没有考虑数据集自身(邻域内)的局部密度。这时就需要引入Density-based方法。其中,以Local Outlier Factor (LOF)最为经典,几乎其它的Density-based算法都是LOF的变种。

       为了理解LOF算法,几个概念需要明

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值