论文:
Angle-Based Outlier Detection in High-dimensional Data,kdd2008
问题
高维度情况下,距离同质化。
基础:
1、在高维空间中角度比距离更稳定[1]
2、如果其他大部分的点都在相似的方向上,那么点O是个离群点
3、如果许多其他的点在不同的方向上,那么点O不是离群点。
方法
对于一个给定的点P,它与任意其他点x,y之间的角度构成一个谱图像angle spectrum。
谱的宽度表示异常点的分数。
图中,蓝色点为内部点,红色点为异常点。
Small ABOD => Outlier
High ABOD => no Outlier