聚类算法——kmeans&Dbscan

1、聚类概念

在这里插入图片描述
两种算法如下:
k指定多少就会得到多少簇,比如上图若k=3,就会把这图上的点聚成三堆。
质心是为了迭代。
标准化:使x,y上的数据都在比较小的范围浮动
优化:对于每一簇,样本上的点到中心点的距离越小越好
在这里插入图片描述
流程:
1、无监督学习不清楚哪个点属于哪一簇的,初始化两个点k=2。
2、遍历并判断样本上的点到红点和蓝点距离,谁小就是属于对应的簇(c)。
3、质心是随机选择的,接着更新质心(d),
4、做步骤2
5、做步骤3
在这里插入图片描述
优缺点:
在这里插入图片描述
迭代可视化展示
DBSCAN算法:
默认指定半径r,阈值minPts在这里插入图片描述
核心点:能发展下线。
边界点:不能发展下线。
离群点:没有点能发展到这个点。
在这里插入图片描述
工作流程:
提前指定参数D、半径r、阈值MinPts
1、所有数据都是未访问到的
2、随机选择一个点p并标记
3、判读p点半径r领域的对象是否多余指定的阈值
4、创建簇C,并把点p添加其中
5、N为点p的r半径领域内的其他点的对象集合
6、遍历N中的每个点
7、如是遍历的点先前未访问,标记其点已访问。
8、判断访问的点的r领域的点是否多余阈值,是的话,把这些点添加到N,一直发展下线,直至点不再是核心对象。
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值