k-means推导和python实现

最新推荐文章于 2022-04-20 14:18:03 发布

dhj_tsukuba

最新推荐文章于 2022-04-20 14:18:03 发布

阅读量257

点赞数 1

分类专栏：算法文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dhj_tsukuba/article/details/110392431

版权

文章目录

一、算法流程
二、推导
三、python代码实现

一、算法流程

首先有2点需要注意：

k-means和 k-nn(k邻近法) 是不一样的，不要混淆。
k-means本身理解起来不难，讲这个是为了引出后面的EM算法，两者有共通之处。

算法流程如下所示，这里以 $k = 3$ , 数据维数 $D = 2$ , 数据样本个数 $N = 500$ 为例：

给定K个聚类中心，用 $\mu$ 来表示，并且适当进行初始化
现在对于给定的 $\mu = (\mu_1,\mu_2,\mu_3)$ , 找出500个样本数据中距离 $\mu_k$ 最近的一批数据标注为类别 $k$
对于属于k类的所有数据进行求平均，将这个平均值作为新的 $\mu_k$ 使用，同时也得到新的 $\mu = (\mu_1, \mu_2, \mu_3)$
对比更新前后的 $\mu$ 值，如果其差量收束的话停止更新，否则重复第2步

二、推导

$x$ : $D$ 维的数据
$X = \{x_1, x_2, .., x_N\}$ : $N$ 个数据样本
$K$ : 聚类数，已知
$\mu_k(k=1,2,..,K)$ : $D$ 维的聚类中心(centriod)
$r_{nk}$ : 第 $n$ 个样本属于 $k$ 类的话该值为1，否则为0

损失函数定义如下：
$\sum_{n=1}^{N}\sum_{k=1}^{K}r_{nk}||x_n-\mu_k||^2$

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
k-means推导和python实现

文章目录一、算法流程二、推导三、python代码实现一、算法流程首先有2点需要注意：k-means和 k-nn(k邻近法) 是不一样的，不要混淆。k-means本身理解起来不难，讲这个是为了引出后面的EM算法，两者有共通之处。算法流程如下所示，这里以k=3k=3k=3, 数据维数D=2D=2D=2, 数据样本个数N=500N=500N=500为例：给定K个聚类中心，用 μ\muμ 来表示，并且适当进行初始化现在对于给定的μ=(μ1,μ2,μ3)\mu = (\mu_1,\mu.
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。