每天五分钟机器学习:为什么多元高斯分布可以解决问题?

本文通过直观分析,解释了为什么在异常检测中使用多元高斯分布能够有效解决问题。相比不使用多元高斯分布,其能捕捉特征间的相关性,形成斜向的判定边界。当样本点的p(x)值低于阈值ε时,会被识别为异常点。
摘要由CSDN通过智能技术生成

本文重点

我们前面学习使用多元高斯分布构造异常检测算法,为什么多元高斯分布就可以解决那个异常点问题,本节课程我们就直观的看一下,为什么它可以?

直观来看

如果不使用多元高斯分布,此时的模型判定边界是

 

如果使用多元高斯分布,此时的模型为蓝色的判定边界

 

多元高斯分布的判定边界是斜着的,它自动捕捉特征之间的相关性(特征x1和特征x2是线性相关的y=kx的关系)。

现在我们拿到了一个新的样本,我们用多元高斯分布来计算p(x),如果p(x)<ε,那么我们就认为它是一个样本点,所以此时我们的模型肯定会认为这个绿色样本为异常点的,因为它并不在辨别边界内。

高斯核函数可以看成一种多元高斯分布,它的等高线全部沿着轴方向的(x1、x2)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

幻风_huanfeng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值