每天五分钟机器学习:使用多元高斯分布升级异常检测算法

本文探讨了使用高斯分布进行异常检测存在的问题,即无法准确识别某些异常样本。提出通过构建新特征和应用多元高斯分布来解决这一问题,通过计算特征的协方差矩阵和均值,形成更精确的判定边界,从而提高异常检测的准确性。
摘要由CSDN通过智能技术生成

本文重点

前面学习的异常检测算法使用的是高斯分布,但是它会有一些问题,本节课程我们使用多元高斯分布。

高斯分布的问题

现在有一个数据集,其中特征x1表示cpu的负载,特征x2表示内存使用量,如果我把这两个特征变量当作高斯分布来建模。建模效果如下所示:

 

我们可以看到如果这样建模的话,绿色样本看起来和很多红色样本一样,并不是异常的。但是可以看到这个绿×离其它红色任何数据都远,而且一个正常的样本应该是CPU负载和内存使用量是彼此线性增长的关系(内存使用量高,CPU负载也应该很高),所以这个样本应该是异常的样本,但是我们的算法对此却无能为力。

因为算法是根据判定边界来决定样本是否是异常样本的,我们可以看到绿×是符合最外面那个判定边界的(ε决定的),所以当我们使用此时的ε来判定时,我们的算法就会认定这个样本不是异常样本。

如何解决这个问题

第一个构建一个新特征=内存量/CPU负载

第二个我们可以想方设法让我们的算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

幻风_huanfeng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值