异常检测

最新推荐文章于 2024-06-13 10:55:23 发布

麓山coder

最新推荐文章于 2024-06-13 10:55:23 发布

阅读量542

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tercel_w/article/details/64920371

版权

机器学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

异常检测

假设样本由N维高斯分布产生，由高斯分布可知，大多数的样本概率密度比较高，少量的样本的概率密度比较小，所以我们可以先用正常的样本训练出高斯分布，然后用这个模型来计算新的样本，如果其概率密度小于某一值，就可以认为该样本是异常的。

如果样本有N个属性，那么可以训练出N维高斯分布，但由于计算量太大了，我们可以假设样本每个维度都符合高斯分布，那我没就可以训练出N个一维的高斯分布了。

模型参数： $\mu_1 , \mu_2 , …, \mu_N , \delta_1,\delta_2,…,\delta_N$

μ i δ 2 i = 1 M \sum m = 1 M x (i) m = 1 M \sum m = 1 M (x (i) m - μ i)

$\begin{eqnarray} \mu_i &&= \frac{1}{M} \sum_{m=1}^Mx_{m}^{(i)} \\ \delta_i^{2} &&= \frac{1}{M} \sum_{m=1}^M(x_m^{(i)} - \mu_i) \end{eqnarray}$
样本的概率密度为

p (x) = \prod i = 1 N 1 2 π ‾ ‾ ‾ \sqrt δ e - ( x - μ i ) 2 2 δ 2

$p( x) = \prod_{i=1}^N \frac{1}{\sqrt{2\pi} \delta} e^{-\frac{(x-\mu_i)^2}{2\delta^2}}$
如果样本

p(x)<ϵ $p(x) <\epsilon$ ，则认为样本是异常的。

$\epsilon$ 通常是由交叉验证确定的，给定一系列 $\epsilon$ ,找出某个值使得在验证集上误差最小。

在异常检测中，也是存在两类样本，那么是否可以使用分类算法呢？其实是不可以的，因为异常样本特别少，而正常样本特别多，使用分类算法学习到的只可能是整个样本空间一部分规律，对于新的异常样本可能不太适用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
异常检测

异常检测假设样本由N维高斯分布产生，由高斯分布可知，大多数的样本概率密度比较高，少量的样本的概率密度比较小，所以我们可以先用正常的样本训练出高斯分布，然后用这个模型来计算新的样本，如果其概率密度小于某一值，就可以认为该样本是异常的。如果样本有N个属性，那么可以训练出N维高斯分布，但由于计算量太大了，我们可以假设样本每个维度都符合高斯分布，那我没就可以训练出N个一维的高斯分布了。模型参数： μ1,μ2
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。