聚类方法知多少

1.K-means聚类

2.层次聚类

层次聚类又分为凝聚聚类和分裂聚类

凝聚聚类:

(1)确认一个度量数据点相似性的距离度量方式:曼哈顿距离、欧几里得距离、相关性系数等

(2)初始时每个数据点都是一个单独的类

(3)根据相似性,逐步合并近的聚类,形成更大的聚类,并重复此操作直到满足停止条件

(4)需要注意的是,在这个合并的过程中可以用树形结构记录聚类之间的合并顺序和相似度

分裂聚类:

(1)确认一个度量数据点相似性的距离度量方式:曼哈顿距离、欧几里得距离、相关性系数等

(2)初始化时,所有的数据点都在同一个聚类里

(3)在聚类中,将距离最远的样本分到两个新的类,重复此操作直到满足条件

3.DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)

DBSCAN是一种基于密度的空间聚类算法,优势在于可以发现任何形状的簇

K-means算法缺点:只能圈球形的簇,对于环形的难以处理;需要预先设定一个好的k

(1)对于每个未做标记的点,找密度可达的所有点

(2)如果该点是核心点,形成一个新的簇,并给簇内的点添加标签;

(3)如果该点是边界点,没有密度可达的点,则访问下一个点;

(4)继续这个过程,直到遍历了所有的点。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值