机器学习-什么是 k-means？

最新推荐文章于 2024-07-22 14:16:25 发布

阿桨

最新推荐文章于 2024-07-22 14:16:25 发布

阅读量1.1k

点赞数 12

分类专栏：数据分析知识问答文章标签：数据分析机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42924611/article/details/138322715

版权

数据分析知识问答专栏收录该内容

26 篇文章 1 订阅

订阅专栏

1、什么是 k-means？

k-means是一种无监督的分类学习算法。它的基本原理是以距离作为相似度的评价指标，用样本点到类别中心的误差平方和作为聚类好坏的评价指标，通过迭代的方法使总体分类的误差评分和函数达到最小的聚类方法。

2、 k-means聚类的k如何确定 ?

确定k-means聚类的k值是一个重要的问题。一种常用的方法是肘部法，即随着k值增大，误差值会越来越小，选择使误差平方和下降最快的k值作为最优的k值。另一种方法是使用轮廓系数，结合内聚度和分离度两种因素来评价不同k值下的聚类效果，选择轮廓系数最大的k值作为最优的k值。

3、k-means聚类的优缺点 ?

k-means聚类的优点包括简单、易于理解和实现，以及时间复杂度低。然而，它也有一些缺点。首先，k-means需要对均值给出定义，并且需要预先指定要聚类的数目k。其次，一些过大的异常值会对聚类结果产生很大影响。此外，k-means算法对初始选值敏感，可能导致不同的初始选值产生不同的聚类结果。最后，k-means更适合球形聚类，对于非球形或不规则形状的聚类可能效果不佳。

4、k-means聚类和层次聚类的差异 ?

k-means聚类和层次聚类的主要差异在于聚类的方式和适用场景。k-means聚类是一种基于距离的聚类方法，通过迭代将数据划分为k个固定的聚类。而层次聚类则通过构建树状图来揭示数据的层次结构，可以聚类成其他形状，并且不需要预先制定聚类数。因此，在选择聚类方法时，需要根据数据集的特征和对聚类结果的期望来决定。

5、k-means聚类如何更好地规避初始点的选择对模型造成的误差 ?

为了更好地规避初始点的选择对k-means模型造成的误差，可以采取一些策略。例如，可以多次运行k-means算法，每次使用不同的初始点，并选择最优的聚类结果。另外，也可以采用一些改进的k-means算法，如k-means++，它使用更智能的初始点选择策略来减少误差。

6、k-means 聚类和DBSCAN 模型的差异和优缺点

k-means聚类和DBSCAN模型在聚类方法、适用场景和优缺点等方面存在显著差异。k-means是基于距离的聚类方法，适用于凸数据集和球形聚类，但对初始选值和异常值敏感。而DBSCAN是基于密度的聚类方法，可以对任意形状的稠密数据集进行聚类，并在聚类的同时发现异常点，但对密度不均匀的数据集聚类效果可能不佳。

关注

12
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
机器学习-什么是 k-means？

k-means是一种无监督的分类学习算法。它的基本原理是以距离作为相似度的评价指标，用样本点到类别中心的误差平方和作为聚类好坏的评价指标，通过迭代的方法使总体分类的误差评分和函数达到最小的聚类方法。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。