R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
——百度百科
由于R语言可以很好地进行统计计算等工作,提供了一系列对聚类、分类算法实现的包,所以对于数据挖掘等工作有很大的帮助。
一、基于密度的DBSCAN算法
在进行调用DBSCAN算法的接口之前,需要使用命令安装依赖库,命令如下:
install.packages("fpc", dependencies = TRUE)
在R语言的fpc包中提供了实现DBSCAN聚类算法并进行可视化的函数,如下:
dbscan(data, eps, MinPts, scale, method, seeds, showplot, countmode)
data:进行聚类的数据(可以是原始数据矩阵,也可以是一个距离矩阵);
eps&