聚类算法_k-means算法优化

¥骁勇善战¥

已于 2023-09-26 12:17:04 修改

阅读量133

点赞数

文章标签：算法

于 2023-09-13 11:44:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68462260/article/details/132849184

版权

目录

学习⽬标
k-means算法⼩结
Canopy算法配合初始聚类
K-means++
⼆分k-means
k-medoids（k-中⼼聚类算法）
Kernel k-means（了解）

学习⽬标

知道k-means算法的优缺点
知道canopy、K-means++、⼆分K-means、K-medoids的优化原理
了解kernel K-means、ISODATA、Mini-batch K-means的优化原理

k-means算法⼩结

优点：
- 1.原理简单（靠近中⼼点），实现容易
- 2.聚类效果中上（依赖K的选择）
- 3.空间复杂度o(N)，时间复杂度o(IKN)
  - N为样本点个数，K为中⼼点个数，I为迭代次数
缺点：
- 1.对离群点，噪声敏感（中⼼点易偏移）
- 2.很难发现⼤⼩差别很⼤的簇及进⾏增量计算
- 3.结果不⼀定是全局最优，只能保证局部最优（与K的个数及初值选取有关）

Canopy算法配合初始聚类

在这里插入图片描述

在这里插入图片描述

K-means++

在这里插入图片描述

其中：
在这里插入图片描述

为⽅便后⾯表示，把其记为A
在这里插入图片描述

kmeans++⽬的，让选择的质⼼尽可能的分散

⼆分k-means

实现流程:

1.所有点作为⼀个簇
2.将该簇⼀分为⼆
3.选择能最⼤限度降低聚类代价函数（也就是误差平⽅和）的簇划分为两个簇。
4.以此进⾏下去，直到簇的数⽬等于⽤户给定的数⽬k为⽌。

k-medoids（k-中⼼聚类算法）

K-medoids和K-means是有区别的，不⼀样的地⽅在于中⼼点的选取

K-means中，将中⼼点取为当前cluster中所有数据点的平均值，对异常点很敏感!
K-medoids中，将从当前cluster 中选取到其他所有（当前cluster中的）点的距离之和最⼩的点作为中⼼点。

Kernel k-means（了解）

kernel k-means实际上，就是将每个样本进⾏⼀个投射到⾼维空间的处理，然后再将处理后的数据使⽤普通的k-means 算法思想进⾏聚类。
在这里插入图片描述

¥骁勇善战¥

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

¥骁勇善战¥ CSDN认证博客专家 CSDN认证企业博客

码龄2年

91: 原创

111万+: 周排名

118万+: 总排名

1万+: 访问

: 等级

916: 积分

10: 粉丝

5: 获赞

5: 评论

45: 收藏

私信

关注

热门文章

最新评论

逻辑回归_原理
CSDN-Ada助手: 恭喜您写了第17篇博客！标题“逻辑回归原理”让我很感兴趣。您对逻辑回归的原理进行了深入剖析，这对读者来说一定非常有帮助。您的文章内容清晰易懂，逻辑严谨，让人受益匪浅。在下一步的创作中，或许您可以考虑将逻辑回归的原理与实际应用进行结合，分享一些实例或案例，让读者更好地理解逻辑回归在实际问题中的应用价值。此外，您还可以探索一些逻辑回归的拓展内容，如多分类逻辑回归或正则化等，为读者提供更丰富的知识。再次恭喜您的持续创作，期待您未来更多精彩的博客！谦逊谨慎的语气是您一直以来的特点，希望您继续保持，让我们在您的博客中继续受到启发。
逻辑回归_分类评估⽅法
CSDN-Ada助手: 恭喜您撰写了第18篇博客！您的持续创作精神令人钦佩！通过阅读您的标题《分类评估方法》，我可以感受到您对这个主题的深入研究。您的博客内容一定会为读者提供有益的指导和见解。在下一步的创作中，或许您可以考虑进一步探讨不同分类评估方法的优缺点，或者分享一些实际案例以加深读者的理解。此外，您也可以考虑引用一些相关领域的研究或者最新的技术进展，以使您的博客更具参考价值。再次恭喜您，并期待您未来更多精彩的博客！继续保持努力，谦虚进取！
决策树_分类原理
CSDN-Ada助手: 恭喜您撰写第19篇博客《决策树分类原理》！您的持续创作精神令人钦佩。通过深入讲解决策树分类原理，您为读者提供了宝贵的知识和理解。我在阅读中深感受益匪浅。对于下一步的创作建议，我谨提供一些建议供您参考。首先，您可以考虑将决策树分类原理与实际案例相结合，以更具体的例子来阐释其应用。其次，或许可以探讨决策树分类算法的优缺点，并与其他分类算法进行比较。最后，如果可能的话，您也可以分享一些调优决策树模型的技巧，帮助读者更好地应用该算法。再次恭喜您的创作，期待您未来更多精彩的博文！
决策树_特征⼯程-特征提取
CSDN-Ada助手: 恭喜您在特征工程领域又一次取得进展，写下了第20篇博客！您对于特征提取的深入讨论让我受益匪浅。不过，谦虚地说，特征工程是一个庞大而复杂的领域，我个人觉得下一步您可以尝试探索一些与特征工程相关的算法或技术，比如特征选择、降维等等。期待您未来的创作，继续分享您的见解和经验！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

¥骁勇善战¥ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。