由于近期检测工作中需要构建概率模型,经由老师推荐,选用高斯混合模型。因此在此记录对高斯混合模型的学习内容。
混合高斯模型用来根据训练样本构建数据的概率模型,从而对测试数据的概率值进行预测。
1 所涉及公式介绍
高斯混合模型公式:
(1)
其中x为样本数据, 一共包含K个高斯模型, 表示第k个高斯模型所占权重,
为第k个高斯模型的均值与方差。
极大似然估计:
(2)
最大化上述结果,或者加上负号后最小化上述结果。
2 模型构建过程
混合高斯模型一般采用EM算法(期望最大化)来进行模型构建,
- 首先随机化初始参数,
- 计算此时第n个样本落在第k个高斯模型的概率:
- 根据此时模型的参数来对参数进行更新(
表示第k个高斯模型中所包含的样本数):
- 再进行第二次迭代,直至最终公式(2)中的结果不再发生明显较大的变化(此处要根据训练结果自己进行调整)