系统聚类和DBSCAN

目录

系统聚类

1.定义:

2.spass操作

3.确定K的方法—肘方法

DBSCAN

1.定义

2.matlab操作

算法选择建议

系统聚类

1.定义:

系统(层次)聚类的算法流程:

一 、将每个对象看作一类,计算两两之间的最小距离

 二、将距离最小的两个类合并成一个新类

 三、重新计算新类与所有类之间的距离

四、重复二三两步,直到所有类最后合并成一类; 五、结束。

2.spass操作

spass处理后得到树状图

我们可以根据这个来确定我们K的数量!!!

3.确定K的方法—肘方法

简单来说,就是算出每个分类中每一个点到重心的距离累加起来。

拐点就是我们要找的K值!!!

DBSCAN

1.定义

DBSCAN算法将数据点分为三类:

• 核心点:在半径Eps内含有不少于MinPts数目的点

• 边界点:在半径Eps内点的数量小于MinPts,但是落在核心 点的邻域内

• 噪音点:既不是核心点也不是边界点的点

2.matlab操作

epsilon=0.5;
MinPts=10;
IDX=DBSCAN(X,epsilon,MinPts);

算法选择建议

只有两个指标,且你做出散点图后发现数据表现得很“DBSCAN”,这时 候你再用DBSCAN进行聚类。

其他情况下,全部使用系统聚类吧。

K-means也可以用,不过用了的话你论文上可写的东西比较少。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值