文章概述
异常数据检测 | Python实现ADTK时间序列异常数据检测
智能运维AIOps的数据基本上都是时间序列形式的,而异常检测告警是AIOps中重要组成部分。
模型描述
笔者最近在处理时间序列数据时有使用到adtk这个python库,在这里和大家做下分享。
什么是adtk?
adtk(Anomaly Detection Toolkit)是无监督异常检测的python工具包,它提供常用算法和处理函数:
简单有效的异常检测算法(detector)
异常特征加工(transformers)
处理流程控制(Pipe)
程序设计
- 安装
pip install adtk
adtk数据要求
时间序列的数据主要包括时间和相应的指标(如cpu,内存,数量等)。python中数据分析一般都是pandas的DataFrame,adtk要求输入数据的索引必须是DatetimeIndex。
pandas提供了时间序列的时间生成和处理方法。
# pd.date_range
stamps = pd