2-8 聚类算法介绍
主目录点这里
什么是聚类
聚类尝试在没有训练的条件下,对一些没有标签的数据进行归纳分类。根据相似性对数据进行分组,以便对数据进行概括。没有标签是指我们事先不知道任何样本的类别标记,希望通过某种算法把这一组位置类别的样本化分成若干类别,聚类的时候,并不关心某一类是什么,实现的只是将相似的东西聚在一起。
总的来说,聚类就是对大量未知标注的数据集,按数据内在的相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。这是一种无监督的分类方式。
聚类的目标
聚类方法好坏判断
常见聚类方法
K-means算是最常用的,我在后面也会有实战的讲解
以下是常用到的聚类方法的优缺点对比