基于R的聚类分析(DBSCAN,基于密度的聚类分析)

这篇博客探讨了在面对非典型形状的样本点时,传统的K-means聚类方法可能失效的问题,并引入了DBSCAN(基于密度的聚类分析)算法。通过R语言的代码示例,展示了DBSCAN如何有效地进行聚类,与K-means对比,突显了DBSCAN在处理复杂形状数据集的优势。
摘要由CSDN通过智能技术生成

DBSCAN聚类分析(基于R语言)
在上一讲中,主要是给大家介绍了,K-means聚类,层次聚类这两种聚类方法是最为典型的两种聚类方法。K-means聚类基本原理是这样的,在n个样本点中,首先提前设定要聚类几类,比如说要聚成三类,那么在n个样本点中先随机选择三个点,最为初始点,将剩下的n-3个点按照距离的原则(所谓聚类原则就是哪个点距离它近,就将这个点分配给它),分别分配到这三个点。这样的话,就初步形成三大类点了。每一大类的中心值作为新的中心点,再重新安装距离的原则进行重新分配,不断重复,直至聚类中心稳定。而层次聚类呢,首先是求得所有样本点的两两相似性。在此基础上就可以形成层次关系,最终是由我们自己确定聚为几类,比如说,我们要聚成三类,那么就沿着层次结构图横着画一条线,线下刚好三类。
在这一讲当中,我们介绍一种新的聚类方法,叫DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类法,也是非常经典的一个算法了。是基于密度的聚类算法,首先说为什么会有这种聚类算法,而且为什么是基于密度的。基于密度有啥好处。我们首先说,为什么需要这种聚类算法。我们通过代码来说明。首先我们先产生一个待聚类的样本点,并且利用R将其画出来,如下

#载入包
library(factoextra)
librar(ggplot2)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值