Outlier Analysis 2nd Edition笔记(一)

简介

关于时间序列的一个假设是temporal continuity. 说的是数据在时间上具有连续性, 如果不连续, 那就算是异常数据.

Temporal continuity refers to the fact that the patterns in the data are not expected to change abruptly, unless there are abnormal processes at work.

在带有时间维度的多维度数据中(例如文字流数据), temporal continuity效应是很弱的, 目前本章的时间序列检测只适用于如下两个场景:

  1. 纯时间序列数据
  2. 带有时间维度的多维度数据

在多维数据中, 异常既可以发生在时间相关的序列数据中, 也可能发生在与时间无关的独立数据点中, 前者需要检查时间上的数据连续性, 而后者的异常检测和普通数据的异常检测非常类似.

The anomalies in multidimensional streaming data could correspond to either time-instants at which aggregate trends have changed or movelties in individual data points.

Contextual or collective

时间序列中的异常只包含两种: 时间维度相关的(contextual)和时间维度无关的(整个序列数据都是异常值)

Outliers are contextual when the values at specific time stamps suddenly change with respect to their temporally adjacent values

Outliers are collective when entire time series or large subsequences within a time series have unusual shapes.

连续型数据和离散型数据

这里有要注意的地方, 两种不同类型数据的时间序列异常检测方法是不同的, 离散型数据没有连续型数据那样的大小序列的性质.

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值