异常检测 Anomaly Detection研究进展梳理
异常检测也叫新颖性检测,通俗来讲是指在给定数据中检测出与预期的数据(正常)不同的、未曾出现的、极少出现的部分数据(异常)。比如工业上的产品瑕疵检测,人行道上的非常规性的行走检测……
由于异常现象的不可知,数据量少等特点,故想要得到大量异常数据对模型进行训练是不可行的,也就是说目前数据集的现状是,在每个类型数据集中,异常数据只占一小部分,大部分都是正常的(预期)的数据。高度依赖于手动标记的正常训练数据。
挑战:
正常数据和异常数据之间的界限不是特别精确
1,异常行为会自适应变化来逃避异常检测,即当前的异常检测方法不一定会适应未来的方法。
2,用于训练和验证的标记数据很难获得,数据不均衡。
3,所以我们从当前背景已有的条件着手梳理一下异常检测的研究脉络。
一开始就可以想到的是只用正常数据来进行训练已达到异常检测的目的,
主要理论如下图所示,将测试数据输入到训练好的模型中,通过特征的提取或者预测再送进已经训练好的特征鉴别器中进行异常检测。
缺点:存在模型的泛化能力比较好的情况,对异常的出现不能很好地检测出来!