本文重点
我们前面学习使用多元高斯分布构造异常检测算法,为什么多元高斯分布就可以解决那个异常点问题,本节课程我们就直观的看一下,为什么它可以?
直观来看
如果不使用多元高斯分布,此时的模型判定边界是
如果使用多元高斯分布,此时的模型为蓝色的判定边界
多元高斯分布的判定边界是斜着的,它自动捕捉特征之间的相关性(特征x1和特征x2是线性相关的y=kx的关系)。
现在我们拿到了一个新的样本,我们用多元高斯分布来计算p(x),如果p(x)<ε,那么我们就认为它是一个样本点,所以此时我们的模型肯定会认为这个绿色样本为异常点的,因为它并不在辨别边界内。
高斯核函数可以看成一种多元高斯分布,它的等高线全部沿着轴方向的(x1、x2)