聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法。
类别 | 主要算法 |
---|---|
划分方法 | K-Means、K-MEDOIDS(K中心点)、CLARANS(基于选择的方法) |
层次分析方法 | BIRCH(平衡迭代规约和聚类)、CURE(代表点聚类)、CHAMELEON(动态模型) |
基于密度的方法 | DBSCAN(基于高密度连续区域)、DENCLUE(密度分布函数)、OPTICS(对象排序识别) |
基于网格的方法 | STING(统计信息网络)、CLIOUE(聚类高维空间)、WAVE-CLUSTER(小波变换) |
基于模型的方法 | 统计学方法、神经网络方法 |
聚类分析评价
(1)purity评价法
(2)RI评价法
(3)F值评价法
主要函数
kmeans()、pam()、dbscan()、Mclust()