K-Means(无监督算法)

最新推荐文章于 2024-01-05 21:25:39 发布

qinjunu

最新推荐文章于 2024-01-05 21:25:39 发布

阅读量735

点赞数

分类专栏： machine learning 文章标签： K-Means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qj970514/article/details/99224065

版权

machine learning 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

概述

K-Means是一种聚类算法，算法过程是以迭代的方式进行的。

详解

1. Input

K（从数据中聚类出的簇的个数）
Training set (drop x_0 = 1)

2. Process

Randomly initialize K cluster centroids μ1，μ2，.....，μk       %随机初始化聚类中心
Repeat{
	%簇分配：离哪一个聚类中心近，将其分配到其对应簇。（保持聚类中心不变的情况下，最小化 J）
	for i = 1 to m
		c^(i) := index (from 1 to K) of cluster centroid closest to x^(i)   %c^(i)表示x(i)对应的簇
	%移动聚类中心：计算不同簇的均值，作为新的聚类中心。（选择聚类中心 μ，来最小化 J)
	for k = 1 to K
		u_k := average (mean) of points assigned to cluster k
}

如果存在一个没有点的聚类中心，一般将其移除。

3. 优化目标函数

μ_c^(i) 表示 x^(i) 已经分配的聚类中心
目的：1.帮助我们对学习算法进行调试，，确保K-Means正确进行。
2.帮助找到更好的簇，并避免局部最优解。

4. 随机初始化

K < m

5. 选择簇的个数 K

肘部法则（Elbow method）:如下左图；但不能解决所有情况，如右图。
结合实际情况，看哪个聚类数量能更好的应用于后续目的

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。