机器学习第九周(三)--多元高斯分布

多元高斯分布

以一个例子引入:
这里写图片描述
把这俩个特征单独拿出来都是符合高斯分布的,现有一个绿色的异常点,我们很难从x1和x2这俩个维度下去判别是否是异常点。
因为从左图看,正常数据是分布在椭圆范围内,我们使用的异常检测算法是从中心区域向外以正圆的形式扩展的,当我们碰到左上角的绿色点时,很有可能就处于正常数据等同的同心圆内,所以就不能判定异常。

所以我们需要改良版的异常检测算法—-多元高斯分布

多元高斯引入

多元高斯分布
在多元高斯分布中,不要把模型  p(x1)  ,  p(x2)  ,…,  p(xn)  分开,而要建立  p(x)  整体的模型。
多元高斯分布的参数包括向量 μ  和矩阵   。具体公式如上图。
我们关键在于弄清综合后的模型  p(x) 


多元高斯图像

下面给出一些多元高斯模型的图像,有助理解。
多元高斯1
2
3

矩阵   中元素对应x1和x2,矩阵   的改变就是x1和x2的改变。

还可以通过改变非对角线元素进行建模,得到不同的高斯分布。
非对角线
2

当对角线元素设为负数时,图像的方向会发生变化。

同理,改变 μ  也就是移动分布中心。
改变u


多元高斯分布解决异常检测

多元高斯分布定义

多元高斯分布
改变俩个参数 μ    ,会得到不同的高斯分布,这俩个参数的计算如上图所示。


多元高斯分布检测异常

1、首先用训练集拟合模型  p(x) 
2、对于新数据,计算  p(x) 
3、判定是否  p(x)  < ϵ 

应用


多元高斯模型和原始模型关系

原始模型
原始模型是多个分模型相乘在一起的。原始模型可看作是高斯模型的一个特例。在协方差矩阵   的非对角线元素都为0的情况下,这两者是相同的。


原始模型和多元高斯模型的选择

俩种模型选择

原始模型多元高斯模型
手动选择新特征自动捕捉不同变量之间的相关性
计算代价更小计算更加复杂
m很小时也能work必须满足m>n,且   必须是不可逆的,即m要远大于n,至少满足m>10n


注意:   是奇异矩阵可能的原因

1、 m>n这个关系没有满足。
2、有冗余特征,比如出现有x1=x2,或者x3=x4+x5,这些都是冗余特征,因为x1和x3并没有包含额外的信息。

  • 6
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值