笔记基于论文Opprentice:Towards Practical and Automatic Anomaly Detection Through Machine Learning
概要:人工调整检测器参数和阀值仍然是巨大挑战,提出opprentice方法,用工具对kpi异常周期性标注,同时使用大量检测器来提取异常特征,然后用标签和特征来训练随机森林区分,自动选择合适的检测器参数和阀值。该方法能保证一定的精度并提高标注数据的速度。
1 介绍
定义挑战:无法精确定义异常
检测器挑战:选择合适的检测器需要算法知识和KPI相关领域知识,调参和设置阀值非常消耗时间
为解决挑战,提出使用监督机器学习的方法,方法基于两个关键发现。
- 对于操作者而言检测时间序列数据并标注异常是简单的
- 由不同的检测器衡量的异常严重程度可以充当机器学习的特征,每个检测器可以当作特征提取器。
Opprentice从标注数据中学习,如同一个操作者学徒。将大量的检测器同时运用在KPI数据中来提取特征,然后将特征和标签用于训练机器学习模型,使得模型能够自动选择合适的检测器参数和阀值,来满足操作者的精度要求。
文章主要贡献:
- Opprentice是第一个运用机器学习来获得异常定义并自动结合和调整不同检测器来满足操作者精度要求的检测框架
- Opprentice用机器学习解决了标签过多、罕见异常、类别失衡、不相关与冗余特征的问题
- 在顶级的全球搜索引擎上搭建并评价了Opprentice,Opprentice表现稳定并能满足一定精度要求,而且只在标签数据时花费了几十分钟,而操作者一般需要耗费数天来选择检测器和调参并且无法保证质量。
2 背景
名词