K-Means算法

最新推荐文章于 2024-09-23 17:15:57 发布

weixin_30457551

最新推荐文章于 2024-09-23 17:15:57 发布

阅读量124

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/jeapwu/p/11522210.html

版权

K-Means聚类算法不用给出数据集的聚类标签，因此它是一种无监督学习算法，在没有十分明显的分类界限的聚类问题中十分有用。
在聚类问题中我们考虑如下数据集$\{x^{(1)},\cdots x^{(n)})\}$，我们想要将这些数据点划分到几个集群中，使用K-Means聚类算法的步骤如下：

\[ \begin{align} \underset{\mu}{min} \underset{C}{min} \sum_{i=1}^{K} \sum_{x \in C_i}|x-\mu_{i}|^2 \end{align} \]

随机选取K个点 $ u_{1},u_{2} \dots,u_{k} $ 作为聚类中心，其中K表示聚类个数，该参数由人为设定。

对于每一个样本$i$，将样本分配给最近的聚类中心(分配依据：该样本到每个聚类中心的欧式距离)：
\[ \begin{align} c^{i}=arg \underset{j}{min} ||x^{(i)}-u_j||^2 \end{align} \]
对于每一个聚类$j$，用类内样本的质心更新聚类中心：
\[ \begin{align} u_{j}=\dfrac{\sum_{i=1}^n 1 \cdot \{c^{(i)}=j \}x^{(i)}}{\sum_{i=1}^n 1 \cdot \{c^(i)=j \} } \end{align} \]