R聚类算法-DBSCAN算法

最新推荐文章于 2022-06-16 07:35:13 发布

小力丸

最新推荐文章于 2022-06-16 07:35:13 发布

阅读量6.3k

点赞数 5

分类专栏： R数据挖掘篇文章标签： R 聚类算法 dbscan算法密度聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lll1528238733/article/details/76024700

版权

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）是一种基于密度的聚类算法，适合处理不规则形状的簇。在R中，可以使用'fpc'包的dbscan函数来实现。该算法通过设定领域大小（eps）和最小点数阈值（MinPts）来确定核心点、边界点和噪声点。核心点是其邻域内至少包含MinPts个点的点，边界点和噪声点则根据密度和邻域关系定义。

摘要由CSDN通过智能技术生成

DBSCAN算法（Density-Based Spatial Clustering of Application
with Noise）密度聚类算法
基于密度的聚类算法，K-means和层次聚类对于球状的簇聚类效果很好，DBSCAN可以用于更多复杂形状簇的聚类。

这里写图片描述

R中实现DBSCAN算法的API
“fpc”包
install.packages(“fpc”)
dbscan(data,eps,MinPts)

data 样本数据 eps
领域的大小，使用圆的半径表示
Minpts 领域内，点的个数的阈值

理解概念：
这里写图片描述
密度（Density）
空间中任意一点的密度是以该点为圆心，以EPS为半径的圆区域内包含的点数目
N的密度为1，B、C的密度为2，A的密度为4

邻域（Neighborhood）
空间中任意一点的邻域是以该点为圆心、以EPS为半径的圆区域内包含的点集合

核心点（Core Points）
空间中某一点的密度，如果大于某一给定阈值MinPts,则称该点为核心点
设MinPts为3，则核心点为A

边界点（Border Points）
空间中某一点的密度>1并且小于MinPts
图中的边界点为B、C

噪声点（Noise Points）
数据集中不属

最低0.47元/天解锁文章

关注

5
点赞
踩
46

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。