分类
是一种基于密度的outlier detection
思想
它不使用局部密度,而是利用近邻将数据构造成图。
与其他KNN方法不同的是,它不用设定K作为参数,而是设定一个maximal inter-observation distance(被称为图resolution)的参数。在算法中,如果两个点之间的距离小与图resolution,就在他们之间加一个边。当整张图构建完成以后,通过设定一个阈值P,决定哪些部分构成了数据的“背景”。如果某一个部分的数据点数目小于p,那么这个部分被视为异常的部分,这部分的所有数据点都被视为异常值。
算法
见Topological Anomaly Detection