各种聚类方法比较

最新推荐文章于 2024-05-15 09:47:32 发布

AI算法网奇

最新推荐文章于 2024-05-15 09:47:32 发布

阅读量3.3k

点赞数

分类专栏：深度学习宝典

本文链接：https://blog.csdn.net/jacke121/article/details/115922171

版权

深度学习宝典专栏收录该内容

984 篇文章 713 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了聚类算法的原理和种类，包括层次聚类、基于划分的方法（如K-means）、基于密度的方法（如DBSCAN）和基于模型的方法（如GMM）。文章讨论了各类方法的优缺点，强调了它们在处理不同类型数据和规模时的适用性，以及如何衡量聚类算法的优劣。此外，还提到了数据简化方法和相似性衡量在聚类中的作用，以及聚类在实际项目中的应用。

摘要由CSDN通过智能技术生成

最近项目用到聚类算法，将其系统的总结一下。

一、简要介绍
1、聚类概念
聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大，同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起，不同数据尽量分离。

2、聚类和分类的区别
聚类技术通常又被称为无监督学习，因为与监督学习不同，在聚类中那些表示数据类别的分类或者分组信息是没有的。
Clustering (聚类)，简单地说就是把相似的东西分到一组，聚类的时候，我们并不关心某一类是什么，我们需要实现的目标只是把相似的东西聚到一起。因此，一个聚类算法通常只需要知道如何计算相似度就可以开始工作了，因此 clustering 通常并不需要使用训练数据进行学习，这在Machine Learning中被称作unsupervised learning (无监督学习)。
Classification (分类)，对于一个classifier，通常需要你告诉它“这个东西被分为某某类”这样一些例子，理想情况下，一个 classifier 会从它得到的训练集中进行“学习”，从而具备对未知数据进行分类的能力，这种提供训练数据的过程通常叫做supervised learning (监督学习)。

3、衡量聚类算法优劣的标准
不同聚类算法有不同的优劣和不同的适用条件。

了解本专栏

超级会员免费看

AI算法网奇

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
各种聚类方法比较

最近项目用到聚类算法，将其系统的总结一下。一、简要介绍1、聚类概念聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大，同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起，不同数据尽量分离。2、聚类和分类的区别聚类技术通常又被称为无监督学习，因为与监督学习不同，在聚类中那些表示数据类别的分类或者分组信息是没有的。Clustering (聚类)，简单地说就是把相似的东西分到一组，聚类的时候，我们...
复制链接

扫一扫