[深度之眼机器学习训练营第四期]K-means聚类

最新推荐文章于 2021-08-09 10:43:49 发布

nudt_oys

最新推荐文章于 2021-08-09 10:43:49 发布

阅读量343

点赞数

分类专栏：机器学习文章标签：聚类机器学习

本文链接：https://blog.csdn.net/qq_26658823/article/details/104595960

版权

机器学习专栏收录该内容

21 篇文章 1 订阅

订阅专栏

K-means聚类算法

聚类是一种无监督学习方法。在无监督学习中，训练集只包含 $\{x^{(1)},x^{(2)},\cdots,x^{(n)};x^{(i)}\in \mathbb{R^d}\}$ ，每个训练样本没有对应的标签 $y^{(i)}$ 。 $k\text{-means}$ 是一种常用的聚类算法。 $k\text{-means}$ 首先随机地选择 $k$ 个簇中心，然后通过每个样本与所有簇中心的距离不断地更新 $k$ 个簇中心，直到算法收敛。整个算法的流程如下所示：

$\begin{aligned} 1.\ &\text{Initialize }\textbf{cluster centroids }\mu_1,\mu_2,\cdots,\mu_k\in \mathbb{R^d}\text{ randomly}\\ 2.\ &\text{Repeat until convergence: \{}\\ &\quad\quad\text{For every }i\text{, set}\\ &\quad\quad\quad\quad\quad\quad\quad\quad c^{(i)} := \arg\min_j \|x^{(i)}-\mu_j\|^2\\ &\quad\quad\text{For each } j\text{, set}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\mu_j := \frac{\sum_{i=1}^{n}\{c^{(i)}=j\}x^{(i)}}{\sum_{i=1}^n\{c^{(i)} = j\}}\\ &\} \end{aligned}$
其中内循环重复执行两个步骤：将每个训练样本 $x^{(i)}$ “分配”到离他最近的簇中心 $\mu_j$ ，以及将每个簇中心 $\mu_j$ 移动到分配给它的所有样本的均值（即中心）。

收敛性

那么 $k\text{-means}$ 算法是不是保证一定收敛呢？答案是肯定的。考虑如下失真函数：
$J(c,\mu)=\sum_{i=1}^n\|x^{(i)}-\mu_{c^{(i)}}\|^2$
该函数衡量了每个训练样本 $x^{(i)}$ 到分配给该样本的簇中心 $\mu_{c^{(i)}}$ 的距离平方。可以看出， $k\text{-means}$ 算法恰好是 $J$ 的坐标下降。具体而言， $k\text{-means}$ 的内层循环在保持 $\mu$ 固定的同时，相对于 $c$ 反复最小化 $J$ ；然后在保持 $c$ 固定的同时，相对于 $\mu$ 最小化 $J$ 。因此， $J$ 必须是单调递减的，此时 $J$ 一定收敛。
然而，失真函数 $J(c,\mu)$ 是一个非凸函数，因此 $k\text{-means}$ 算法可能收敛到局部极小值。为了防止此类事件发生，我们可以多次运行 $k\text{-means}$ 算法，然后选择失真函数值最小的那个。