层次聚类算法_聚类算法的发展及原理解析

最新推荐文章于 2024-07-18 17:00:48 发布

weixin_39907316

最新推荐文章于 2024-07-18 17:00:48 发布

阅读量2.1k

点赞数 1

文章标签：层次聚类算法

本文介绍了聚类算法的基本概念，包括k-means、层次聚类算法、基于密度的方法和基于网格的方法。重点解析了层次聚类算法的原理和优缺点，强调了层次聚类无需预先指定类别数量的优势。同时讨论了聚类效果的评价标准，如外在方法中的BCubed和内在方法中的轮廓系数。

摘要由CSDN通过智能技术生成

对于聚类的了解可以从最简单最常用的k-means开始。

旧梦：常用聚类算法k-means总结zhuanlan.zhihu.com

一、什么是聚类算法

聚类的目的是把长得相似的样本放在一起。常用的聚类算法类型有：划分方法（k-means），层次方法，基于密度的方法，基于网格的方法。聚类算法选取取决于数据的类型和聚类的目的。

二、各类算法基本原理及优缺点

（一）划分算法

1.算法原理

K-means聚类，原理是随机选取k个对象，实例距离哪个点近就更可能是哪一类，将每个类的中心点作为新的对象，不断迭代，直到分类完成。算法简单容易实现，但是需要预先确定k值，比较受初始值的影响，且非常受噪声和离群点的影响，最终得到的结果是局部最优。

k-means对离群点敏感，k-中心则是在k-means基础上的改进，主要是中心点的选取方面有所不同，中心点选择的是距离其他点距离之和最近的点作为中心点。改进之后减少了噪声和离群点的影响，但是计算也变得非常复杂，适合小规模数据。

（二）层次聚类算法

划分方法需要指定类的个数即k值，层次聚类则解决了这个问题。层次分析法有两种，一种是凝聚方法，一种是分裂方法。

1.层次法的原理

凝聚方法：先计算样本之间的距离。每次将距离最近的点合并到同一类。然后再计算类与类之间的距离，将距离最近的类合并为一个

最低0.47元/天解锁文章

weixin_39907316

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。