K-means聚类算法背后的EM思想

最新推荐文章于 2023-04-06 00:09:31 发布

Doooer

最新推荐文章于 2023-04-06 00:09:31 发布

阅读量407

点赞数

分类专栏：机器学习算法总结文章标签：算法

机器学习算法总结专栏收录该内容

39 篇文章 1 订阅

订阅专栏

参考JerryLead
[https://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html]
$\qquad$ K-means是聚类算法里最简单的一种，聚类属于无监督学习。K-means算法将样本{ $x_1,x_2,x_3,...x_n$ }，每个样本 $x_i \in R^n$ ,聚类成 $k$ 个cluster。
$\qquad$ 算法描述如下：
$\qquad$ 初始化阶段：从 $N$ 个样本中随机选择 $k$ 个聚类质心点 $c_1,c_2,...c_k$ ,且每个 $c_i \in R^n$ 。
$\qquad$ 迭代阶段直至收敛{
$\qquad$ $\qquad$ $for$ $i = 1$ $to$ $N$ ,计算距离它最近的cluster center
$\qquad$ $\qquad$ $b^{(i)} : = \arg\min\limits_j || x_i - c_j ||^2$
$\qquad$ $\qquad$ $for$ $j = 1$ $to$ $k$ ,重新计算该cluster的质心
$\qquad$ $\qquad$ $c_j :=\frac{ \sum_{i=1}^N 1 \left\{ b^{(i)} = j \right\} x_i} {\sum_{i=1}^N 1 \left\{ b^{(i)}=j \right\} }$
}
$\qquad$ K-means的目标是：
$\qquad\min J(b,c) = \sum_{i=1}^N || x_i - c_{b^{(i)}}||^2$
$\qquad J$ 是非凸函数，意味着K-means不能保证取得的是全局最小值，即K-means对质心初始化比较敏感。如果怕陷入局部最优，那么可以选取不同的初始值跑多次K-means，然后取其最小的 $J$ 对应的 $c$ 和 $b$ 。
$\qquad$ 简单指出EM的思想，E步是估计隐含类别y的期望值，M步调整其他参数使得在给定类别y的情况下，极大似然估计P(x,y)能够达到极大值。然后重新估计y,重复上面的E步,M步，直至收敛。
$\qquad$ 对于K-means而言，开始我们将每个样本归属为距离它最近的cluster center，为了使J最小，我们调整cluster center;然后再将每个样本归属为离它最近的新的cluster center,…上述过程重复下去。可以看到，在K-means中，E步就是确定每个样本隐含变量（硬指定，而不是对每个类别赋予不同的概率），M步更新cluster center来使J最小化。
$\qquad$ 总体思想还是一个迭代优化的过程，有目标函数，有参数变量，多了隐变量，确定其他参数估计隐变量，再由确定的隐变量估计其他参数，直至目标最优。