1、什么是高斯混合模型?
高斯混合模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。
2、高斯混合聚类过程?
- 假设该数据集符合k个高斯分布;(k值如何确定)
- 判断每个样本符合各个分布的概率;(判断函数是什么)
- 将样本划为概率最大的那个分布簇内;
- 更新高斯分布参数,使用极大似然估计;(什么是极大似然估计)
- 基于新的分布去计算符合各个分布的概率;
- 不断迭代,直至模型收敛达到局部最优解。
3、高斯混合聚类初始k值如何确定?
高斯混合模型对初始值的选取敏感,可以使用例如k-means算法对数据集进行预训练
4、如何求解样本符合各个分布的概率?
数据符合高斯分布,进行极大似然估计求解,将极大似然估计值最大的样本划分进去
5、什么是极大似然估计?
极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”
6、极大似然估计函数的求解步骤?
- 写出似然函数;
- 对似然函数取对数,并整理;
- 求导数;
- 解似然方程。
7、什么是高斯概率密度函数(正态分布曲线)?
一元高斯分布、二元高斯分布、多元高斯分布