11-Clustering

最新推荐文章于 2023-02-13 20:08:25 发布

DawnRanger

最新推荐文章于 2023-02-13 20:08:25 发布

阅读量650

点赞数

分类专栏： machine-learning

本文链接：https://blog.csdn.net/DawnRanger/article/details/48168897

版权

22 篇文章 1 订阅

订阅专栏

数据事先没有标记分类。
应用：

K-means
输入：

算法步骤：

随机的选择 K 个 cluster centroids $\mu_1,\mu_2,\dots,\mu_K \in R^n$
$R e p e a t {f o r i = 1 t o m c (i) : = i n d e x o f c e n t r o i d c l o s e s t t o x (i) f o r k = 1 t o K μ k : = a v e r a g e o f p o i n t s a s s i g n e d t o c l u s t e r k}$ $\begin{aligned} Repeat&\{ \\ &for \;i=1 \;to\; m \\ &\quad c^{(i)} := index \;of \;centroid \;closest \;to \;x^{(i)} \\ &for \;k=1 \;to \;K \\ &\quad \mu_k := average \; of \;points \;assigned \; to \;cluster \; k \\ &\} \end{aligned}$

约定的符号：

Optimiation Objective：

m i n J (c (1), \dots, c (m), μ 1, \dots, μ K) = 1 m \sum i = 1 m ∥ x (i) - μ c (i) ∥ 2

$minJ(c^{(1)},\dots,c^{(m)},\mu_1,\dots,\mu_K) = \frac{1}{m}\sum\limits_{i=1}^m\|x^{(i)}-\mu_{c^{(i)}}\|^2$

条件：
- 簇数量 K 应该小于样本数 m：K < m

选取方法：

Elbow method：
Evaluate K-means based on a metric for how well it performs for that later purpose.
例如 T-shirt 尺码的选择

关注

专栏目录