目录
系统聚类
1.定义:
系统(层次)聚类的算法流程:
一 、将每个对象看作一类,计算两两之间的最小距离
二、将距离最小的两个类合并成一个新类
三、重新计算新类与所有类之间的距离
四、重复二三两步,直到所有类最后合并成一类; 五、结束。
2.spass操作
spass处理后得到树状图
我们可以根据这个来确定我们K的数量!!!
3.确定K的方法—肘方法
简单来说,就是算出每个分类中每一个点到重心的距离累加起来。
拐点就是我们要找的K值!!!
DBSCAN
1.定义
DBSCAN算法将数据点分为三类:
• 核心点:在半径Eps内含有不少于MinPts数目的点
• 边界点:在半径Eps内点的数量小于MinPts,但是落在核心 点的邻域内
• 噪音点:既不是核心点也不是边界点的点
2.matlab操作
epsilon=0.5;
MinPts=10;
IDX=DBSCAN(X,epsilon,MinPts);
算法选择建议
只有两个指标,且你做出散点图后发现数据表现得很“DBSCAN”,这时 候你再用DBSCAN进行聚类。
其他情况下,全部使用系统聚类吧。
K-means也可以用,不过用了的话你论文上可写的东西比较少。