![03724e95dd7f156378bd970a1da74b27.png](https://i-blog.csdnimg.cn/blog_migrate/54dd237dc6109cd04bde083617c0d83d.jpeg)
概述
通常时序数据的异常值主要分为三类:
- 异常值 Outlier
给定输入时间序列,异常值是时间戳值对
,其中观测值
,与该时间序列的期望值(即
)不同。
- 波动点 Change Point
给定输入时间序列 x,波动点是指在某个时间 t,其状态(行为)在这个时间序列上表现出
与 t 前后的值不同 。 - 异常时间序列( Anomalous Time-series )
给定一组时间序列,异常时间序列
是在
上与大多数时间序列值不一致的部分
时序数据常用特征
时序数据常见特征
用于建模实验的常见指标,衡量模型好坏
异常检测方法
主要分为三大类:
- 基于统计模型
基于统计模型的异常点检测技术将所有数据构建成一个数据模型,其认为异常点是那些与模型不能完美拟合的对象。 - 基于邻近度
通常可以在对象之间定义邻近性度量。异常对象是那些远离大部分其他对象的对象。 - 基于密度的技术
对象的密度估计可以相对直接计算,特别是当对象之间存在邻近性度量时。当一个点的局部密度显著低于它的大部分近邻时,可能会被看作是异常的。
基于统计模型的异常点检测
基于数据,构建一个概率分布模型,得出模 型的概率密度函数。通常,异常点的概率是很低的。