《实例》阐述算法,通俗易懂,助您对算法的理解达到一个新高度。包含但不限于:经典算法,机器学习,深度学习,LeetCode 题解,Kaggle
实战。期待您的到来!
01
—
回顾
昨天,介绍了高斯混合模型(GMM)的一些有意思的小例子,说到高斯混合能预测出每个样本点属于每个簇的得分值,这个具有非常重要的意义,大家想了解这篇推送的,请参考:
机器学习高斯混合模型:聚类原理分析(前篇)
02
—
GMM求解思路
GMM中的归纳偏好是组成数据的几个簇都满足高斯分布。
GMM求解的已知条件:
被分簇的个数是已知的;
当然,还有那一堆训练数据
GMM算法的任务:预测出每个样本点属于每个簇的得分值,每个簇中得分最大的就是这个样本点属于的簇。
GMM算法的求解思路:我们先从一个簇说起,此时就是一个高斯分布吧。假如已知训练数据有20个,那么这20个数据一定属于当前这个簇吧,因为一共就有1个簇,那是必须属于吧,所以只需要求这个高斯分布的参数:均值和方差,一般参数估计都是用最大似然估计吧,就是每个样本发生的概率乘积最大吧,得到:
这样我们就求出这20个数据满足以上参数的高斯分布的概率密度,再来一个数据时,我们根据这个概率密度的公式,便能得出它的概率密度吧。
那两个簇组成的GMM呢?它和一个簇满足高斯有什么不同呢?只有一个不同