Datawhale 异常检测学习之Task02----基于统计学的方法

最新推荐文章于 2023-08-07 18:10:02 发布

人生半熟

最新推荐文章于 2023-08-07 18:10:02 发布

阅读量185

点赞数

分类专栏：异常检测学习教程文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_38189533/article/details/112638867

版权

文章目录

前言
一、基于统计学的方法
二、代码演示-----HBOS方法
总结

前言

上一篇简单介绍了异常检测的基本概念以及常用库pyod的使用。
异常检测的方法主要有三大类：传统方法、集成方法和机器学习方法。
传统方法又分为基于统计学的方法、基于相似度的方法和线性模型三种。
本篇将主要介绍传统方法中基于统计学的方法

一、基于统计学的方法

主要思想: 学习一个拟合给定数据集的生成模型，在该模型低概率区域中的数据，即为异常点。

基于统计学的方法的不同主要在于该生成模型的建立。据此可以分为两大类：参数方法和非参数方法。

1. 参数方法

1.1 一元数据的异常检测-----基于正态分布

A. 方法步骤

首先假设数据是服从正态分布的，根据样本可以计算出该分布的均值和方差，从而得到正态分布的概率函数。
然后设定一个阈值，并根据该概率函数计算样本点的概率值，若该值不在阈值范围内，则视为异常点。

【公式】
均值： $\mu=\frac 1m\sum_{i=1}^m x^{(i)}$

方差： $\sigma^2=\frac 1m\sum_{i=1}^m (x^{(i)}-\mu)^2$

概率密度： $p(x)=\frac 1{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2})$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Datawhale 异常检测学习之Task02----基于统计学的方法

文章目录前言一、基于统计学的方法1. 参数方法1.1 一元数据的异常检测-----基于正态分布A. 方法步骤1.2 多元数据的异常检测2. 非参数方法2.1 直方图方法2.2 HBOS方法二、代码演示-----HBOS方法1.引入库2.读入数据总结前言上一篇简单介绍了异常检测的基本概念以及常用库pyod的使用。异常检测的方法主要有三大类：传统方法、集成方法和机器学习方法。传统方法又分为基于统计学的方法、基于相似度的方法和线性模型三种。本篇将主要介绍传统方法中基于统计学的方法一、基于统计学的.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。