混合高斯模型

单高斯模型

当样本数据X是一维数据时,高斯分布(正态分布)服从下方概率密度函数,可以用于描述一种数据分布情况。
在这里插入图片描述
当样本是多维时,概率密度函数如下:
在这里插入图片描述

应用原因

对于一个分布由K个簇组成,使用单独的高斯分布很难描述数据的分布情况(如下图所示),这时可通过混合模型来描述。将多个高斯模型按照一定的权重混合为一个模型。
在这里插入图片描述
在这里插入图片描述

模型变量

高斯混合模型中所涉及的变量包括:混合模型的数量K,每个模型对应的分布(μi,δi),及其对应的权值αi。
混合模型的概率分布为:
在这里插入图片描述
其中theta=(μ,δ,α)

模型训练

对于单高斯模型可通过最大似然训练,对于混合模型需要通过EM(期望最大化)迭代训练。
每次迭代包括:E和M两步。
:根据初始化模型参数计算所有点属于各个模型的概率
在这里插入图片描述
:根据所有点计算的概率,利用期望和方差的概念更新模型参数
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
迭代训练多次知道模型参数不再发生变化。

缺点

需要预先设置模型数量K

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值