时序数据异常检测实例--3σ篇

本文通过实例详细介绍了如何运用3σ准则进行离群点检测。首先,介绍原始数据,接着阐述了检测数据均值、标准差以及进行正态分布检验的步骤。然后,展示了3σ算法的代码实现,并讨论了如何通过图形标注增强数据可视化。最后,作者表达了希望与他人交流学习异常检测技术的愿望。
摘要由CSDN通过智能技术生成

              3σ算法检测离群点--实例

一、原数据

如下,共有六列,第一行为空,之后会修正,利用数据整体均值进行代替。

二、文字流程

1. 检测整个数据集的整体均值与标准差,同时利用ks检验判断数据是否符合正态分布。

2. 3σ准则的代码实现(该算法需要数据符合正态分布)

3. 为检测结果图添加各种文字或直线标注,使数据更为直观

三、代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import numpy
from scipy import stats
from pylab import *
import math

#  对整个文件中的数据进行离群点检测
def threesigma(str1, n):  # 3σ的3可以是n,自己根据数据来调整,选检测效果最好的。
    df = pd.read_csv(str1)
    # 第一部分,求dataframe所有列整体的均值和标准差,同时利用ks检验判断数据是否符合正态分布。
    sum = df.sum()
    sum = sum.sum()
    u = sum / (df.shape[0] * df.shape[1])
    # 计算整体均值
    # dataframe按列转list
    columns = df.columns
    print(df.shape)
    print(columns)
    d
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值