异常检测
1.什么是异常?
例如:白天鹅中的一只黑天鹅;产品数据值超出允许的范围;顾客消费出现异常。
2.异常类别?
基于数据点的异常
(即一组数据点中的离群值)
基于上下文的异常
(即看起来正常的数据点在各自上下文环境中却会被认为是异常的)
基于模式的异常
(即数据点背离其历史轨迹的模式和趋势)
3.异常检测的三种样式?
监督异常检测
(训练数据集中的异常和正常数据点都有对应的标签)
半监督异常检测
(训练数据集中仅对一部分数据点添加标签)
无监督异常检测
(训练数据集中的数据都是未添加标签的)
4.异常检测的常见应用领域?
网络服务领域
(防护政府和公司的数据泄露,帮助及时检测出网络入侵攻击)
银行
(检测出信用卡的反常活动,标记反常的高交易量、欺诈活动、网络钓鱼攻击等)
医疗
(包括防止欺诈、癌症或慢性疾病检测、改善门诊服务等)
制造业
(通过检测来提高各种金属零件、工具、引擎、食品、服装等产品的质量)
交通运输
(检测十字路口发生的不正常时间,如交通事故或不正常的交通堵塞)