层次聚类簇数_如何正确选择聚类算法？

最新推荐文章于 2023-11-26 13:28:50 发布

weixin_39793576

最新推荐文章于 2023-11-26 13:28:50 发布

阅读量917

点赞数 1

文章标签：层次聚类簇数通达信移动平均算法

本文探讨了聚类算法的选择，特别是层次聚类在数据模型构建中的应用。介绍了层次聚类、基于质心的k均值、期望最大化（EM）算法和基于密度的DBSCAN，分析了它们的优缺点以及适用场景。选择最佳算法需考虑数据集的特性，如数据分布、密度和簇数需求。

摘要由CSDN通过智能技术生成

作者 | Josh Thompson
编译 | 张睿毅、王雨桐
来源 | 数据派THU
原文 | Choosing the Right Clustering Algorithm for your Dataset - KDnuggets

聚类算法十分容易上手，但是选择恰当的聚类算法并不是一件容易的事。

数据聚类是搭建一个正确数据模型的重要步骤。数据分析应当根据数据的共同点整理信息。然而主要问题是，什么通用性参数可以给出最佳结果，以及什么才能称为“最佳”。

本文适用于菜鸟数据科学家或想提升聚类算法能力的专家。下文包括最广泛使用的聚类算法及其概况。根据每种方法的特殊性，本文针对其应用提出了建议。

四种基本算法以及如何选择

聚类模型可以分为四种常见的算法类别。尽管零零散散的聚类算法不少于100种，但是其中大部分的流行程度以及应用领域相对有限。

基于整个数据集对象间距离计算的聚类方法，称为基于连通性的聚类（connectivity-based）或层次聚类。根据算法的“方向”，它可以组合或反过来分解信息——聚集和分解的名称正是源于这种方向的区别。最流行和合理的类型是聚集型，你可以从输入所有数据开始，然后将这些数据点组合成越来越大的簇，直到达到极限。

层次聚类的一个典型案例是植物的分类。数据集的“树”从具体物种开始，以一些植物王国结束，每

最低0.47元/天解锁文章

weixin_39793576

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
层次聚类簇数_如何正确选择聚类算法？

作者 | Josh Thompson编译 | 张睿毅、王雨桐来源 | 数据派THU原文 | Choosing the Right Clustering Algorithm for your Dataset - KDnuggets聚类算法十分容易上手，但是选择恰当的聚类算法并不是一件容易的事。数据聚类是搭建一个正确数据模型的重要步骤。数据分析应当根据数据的共同点整理信息。然而主要问题是，什么通用性参...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。