聚类分析（二）——K中心点算法（k-mediods）

最新推荐文章于 2023-07-07 08:17:39 发布

Maria21

最新推荐文章于 2023-07-07 08:17:39 发布

阅读量4.1k

点赞数

分类专栏：图像识别

图像识别专栏收录该内容

27 篇文章 0 订阅

订阅专栏

K中心点算法（K-medoids）

前面介绍了k-means算法，并列举了该算法的缺点。而K中心点算法（K-medoids）正好能解决k-means算法中的 “噪声”敏感这个问题。

如何解决的呢？

首先，我们得介绍下k-means算法为什么会对“噪声”敏感。还记得K-means寻找质点的过程吗？对某类簇中所有的样本点维度求平均值，即获得该类簇质点的维度。当聚类的样本点中有“噪声”（离群点）时，在计算类簇质点的过程中会受到噪声异常维度的干扰，造成所得质点和实际质点位置偏差过大，从而使类簇发生“畸变”。

Eg: 类簇C1中已经包含点A(1,1)、B(2,2)、 C(1,2)、 D(2,1)，假设N(100,100)为异常点，当它纳入类簇C1时，计算质点Centroid((1+2+1+2+100)/5,(1+2+2+1+100)/5)=centroid(21,21),此时可能造成了类簇C1质点的偏移，在下一轮迭代重新划分样本点的时候，将大量不属于类簇C1的样本点纳入，因此得到不准确的聚类结果。

为了解决该问题，K中心点算法（K-medoids）提出了新的质点选取方式，而不是简单像k-means算法采用均值计算法。在K中心点算法中，每次迭代后的质点都是从聚类的样本点中选取，而选取的标准就是当该样本点成为新的质点后能提高类簇的聚类质量，使得类簇更紧凑。该算法使用绝对误差标准来定义一个类簇的紧凑程度。

(p是空间中的样本点，Oj是类簇Cj的质点)

如果某样本点成为质点后，绝对误差能小于原质点所造成的绝对误差，那么K中心点算法认为该样本点是可以取代原质点的，在一次迭代重计算类簇质点的时候，我们选择绝对误差最小的那个样本点成为新的质点。

Eg：样本点A –>E1=10

样本点B –>E2=11

样本点C –>E3=12

原质点O–>E4=13，那我们选举A作为类簇的新质点。

与K-means算法一样，K-medoids也是采用欧几里得距离来衡量某个样本点到底是属于哪个类簇。终止条件是，当所有的类簇的质点都不在发生变化时，即认为聚类结束。

该算法除了改善 K-means 的“噪声”敏感以后，其他缺点和 K-means 一致，并且由于采用新的质点计算规则，也使得算法的时间复杂度上升： O （ k(n-k)² ）

转自：http://www.360doc.com/content/11/0608/15/7000788_122468694.shtml

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
聚类分析（二）——K中心点算法（k-mediods）

K中心点算法（K-medoids）前面介绍了k-means算法，并列举了该算法的缺点。而K中心点算法（K-medoids）正好能解决k-means算法中的 “噪声”敏感这个问题。如何解决的呢？首先，我们得介绍下k-means算法为什么会对“噪声”敏感。还记得K-means寻找质点的过程吗？对某类簇中所有的样本点维度求平均值，即获得该类簇质点的维度。当聚类的样本点中有“噪声”
复制链接

扫一扫

专栏目录

Maria21 CSDN认证博客专家 CSDN认证企业博客

码龄12年

187: 原创

3万+: 周排名

215万+: 总排名

15万+: 访问

: 等级

3322: 积分

906: 粉丝

30: 获赞

7: 评论

143: 收藏

私信

关注

热门文章

分类专栏

python
linux
ldap
ladp
juicefs
perl
ad
kerberos
专利
存储 1篇
Linux系统 3篇
11
刷题 161篇
编译
嵌入式 11篇
java
go 2篇
opencv-python 11篇
无线通信 1篇
图像识别 27篇
SQL 2篇
interview 33篇
数据结构 10篇
C/C++ 192篇
进程与线程 7篇
数据库 1篇
通信与网络 6篇
CUDA 11篇
数学 2篇
windows操作系统 1篇

最新评论

leetcode1507 Reformat Date
ctotalk: 收了
leetcode problem 122 Best Time to Buy and Sell Stock II
ctotalk: thanks,欢迎关注一起交流
C语言实现FIFO算法与LRU算法
m0_46521447: 好像有个错，139行int in多此一举了，直接用声明过的p就行了，新增的这个in会导致：当页面出现在物理块中时，不会置对应的页面号tm为0，后面tm++的操作是在上一次p的基础上进行的，tm就乱了。
灰度图像的腐蚀算法和细化算法（C#代码）
zzy717565: 这明明是膨胀算法嘛
LOG算子
qq_26667429: 式4.28的第一个等号怎么来的？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。