1.基本概念
异常检测(Outlier Detection),可以理解为识别与正常数据不同的数据或与预期行为差异大的数据,针对少数事件。
异常的类别:
点异常(point anamalies):只有少数的实例异常
条件异常(conditional anamalies):实例的异常与否与情境有关,指特定情境下的实例是异常的
群体异常(group anomalies):实例本身可能不是异常,但其所在的群体是异常的
任务分类:
有监督、无监督、半监督(训练集中只有正例,异常实例不参与训练)
场景:
故障检测、医疗日常检测、网络入侵检测、欺诈检测、工业异常检测、时间序列异常检测、视频异常检测、日志异常检测
难点:
(1)异常数据量少,属于样本不平衡问题(是否可尝试使用处理样本不平衡的方法来解决?)
(2)有时很