使用概率模型的原因
k均值等价于假设了球对称形状的聚类。使用带权欧式距离,仍然假设了轴对齐的椭球。没有考虑聚类的形状。
促使概率模型的原因:混合模型
- 提供观测点到聚类的软分配soft assignment(分配包含不确定性)
- 考虑了聚类的形状而不仅仅是中心
- 允许从不同维度来学习权重
高斯分布
双变量高斯分步,协方差矩阵的主对角线决定了展度;副对角线决定朝向
k均值等价于假设了球对称形状的聚类。使用带权欧式距离,仍然假设了轴对齐的椭球。没有考虑聚类的形状。
促使概率模型的原因:混合模型
双变量高斯分步,协方差矩阵的主对角线决定了展度;副对角线决定朝向