LOF: Identifying Density-Based Local Outliers
对于许多KDD应用来说,例如发现电子商务中的犯罪活动,发现稀有实例或异常值可能比发现常见模式更有趣。现有的离群点检测工作将离群点视为二值属性。本文认为,在许多情况下,为每个对象分配一个离群点的程度更有意义。这个程度称为对象的局部离群因子(local outlier factor, LOF)。它是局部的,因为程度取决于对象相对于周围邻居的孤立程度。文中给出了详细的形式化分析,表明LOF具有许多理想的性质。使用真实世界的数据集,证明了LOF可以用来发现看似有意义,但用现有方法无法识别的离群点。最后,对我们的算法进行了仔细的性能评估,证实了我们发现局部离群点的方法是可行的。