高斯混合模型
- 高斯混合模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。
- 在统计学中,混合模型是用于表示总体群体中亚群体的存在的概率模型
- 高斯混合模型(Gaussian Mixture Model)为单一高斯概率密度函数的延伸,用多个高斯概率密度函数(正态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(正态分布曲线)分布的统计模型。
- 应用:聚类:样本受到哪个高斯分布的作用大,就认为样本属于哪个高斯分布
比较KMeans
- Kmeans是简单的,因为它是基于假设一个样本仅以1或0的概率属于某一簇,这两者之间的取值并没有考虑,他无法考虑中间的取值,即一个点仅以某个概率属于某个类别是不能计算的。
- 高斯混合模型不是简单的考虑欧式距离的问题,它是使用高斯概率密度函数(正态分布曲线)精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。 高斯模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物
数据如下
Sex Height(cm) Weight(kg)
0 156 50
0 160 60
0 162 54
0 162 55
0 160.5 56
0 160 53
0 158 55
0 164 60
0 165 50
0 166 55
0 158 47.5
0 161 49
0 169 55
0 161 46
0 160 45
0 167 44
0 155 49
0 154 57
0 172 52
0 155 56
0