k-Means的优缺点

最新推荐文章于 2024-06-08 07:00:00 发布

dream or nightmare

最新推荐文章于 2024-06-08 07:00:00 发布

阅读量5k

点赞数 4

分类专栏：机器学习文章标签： kmeans算法 GMM 聚类算法 k-means算法的优缺点 k-Means算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45406155/article/details/109744881

版权

机器学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

k-Means的优缺点

1.1 k-Means的优点

计算复杂度低，为O(Nkq)，其中k为聚类的数量、q为迭代的次数，通常k和q小于N，此时的复杂度相当于O(N)
思想简单，容易实现

1.2 加速k-Means

k均值算法中，每个E步骤都需要计算每个向量和每个数据点之间的欧几里得距离。加速这个过程的方法有：

基于对数据结构的预先计算，例如将数据组织成树结构，使得相邻的数据点属于同一个子树。
使用距离的三角不等式，避免不必要的计算

1.3 k-Means的缺点

k均值算法的基础是将欧几里得距离作为数据点与代表向量之间不相似程度的度量。这不仅限制了能处理的数据变量的类型(比如，它不能处理某些或全部变量表示类别标签的情形)，而且使得聚类的中心的确定对于异常点不具有鲁棒性。
需要选取确定的聚类的数量k，分类的结果严重依赖于簇中心的初始化。结果不一定是全局最优的，只能保证局部最优。对噪声敏感，无法解决不规则形状的聚类。

1.4 k-Means的性质

k-Means实际上假设数据呈现球形分布，与之相比，GMM假设则是高斯分布
k-Means假设各个簇的先验相同，但是各个簇的数量可能不均匀
k-Means算法的迭代过程实际上等价于EM算法

1.5 和GMM的比较

相比k-Means，GMM收敛之前，经历了更多次的迭代，每次迭代需要计算更多的计算量，通常运行k-Means找到GMM的一个合适的初始值，接下来使用GMM进行调节。
k-Means对数据点的聚类进行了硬分配，即每个数据点只属于唯一的一个聚类，而GMM基于后验概率进行了软分配，k-Means可以看成GMM的特殊情形。(没有估计聚类的协方差，只估计了聚类的均值)

dream or nightmare

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
k-Means的优缺点

k-Means的优缺点1.1 k-Means的优点1.2 加速k-Means1.3 k-Means的缺点1.4 k-Means的性质1.5 和GMM的比较1.1 k-Means的优点计算复杂度低，为O(Nkq)，其中k为聚类的数量、q为迭代的次数，通常k和q小于N，此时的复杂度相当于O(N)思想简单，容易实现1.2 加速k-Meansk均值算法中，每个E步骤都需要计算每个向量和每个数据点之间的欧几里得距离。加速这个过程的方法有：基于对数据结构的预先计算，例如将数据组织成树结构，使得相邻的数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。