1.异常检测基本概念
异常检测:识别与正常数据不同的数据,与预期行为差异大的数据。
1.1 异常的类别
点异常:指的是少数个体实例是异常的,大多数个体实例是正常的。
条件异常:又称上下文异常,指的是在1. 异常检测基本概念
异常检测:识别与正常数据不同的数据,与预期行为差异大的数据。
1.1异常的类别
点异常:指的是少数个体实例是异常的,大多数个体实例是正常的。
条件异常:又称上下文异常,指的是在特定情境下个体实例是异常的,在其他情境下都是正常的。
群体异常:在群体集合中的个体实例出现异常的情况,而该个体实例自身可能不是异常,在入侵或欺诈检测等应用中,离群点对应于多个数据点的序列,而不是单个数据点。
1.2 异常检测任务分类
有监督:训练集的正例和反例均有标签
无监督:训练集无标签
半监督:在训练集中只有正例,异常实例不参与训练
2. 异常检测基本方法
2.1.1 基于统计学的方法
异常检测的统计学方法的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点。
利用统计学方法建立一个模型,然后考虑对象有多大概率可能符合该模型。
2.1.2 线性模型
PC