k均值聚类算法考试例题_聚类算法之k-means(基于划分)

k-means聚类算法是一种用于连续型数据的聚类方法,需要预设类别数k。流程包括选择初始中心点,根据距离分配样本,更新中心点直至收敛。其优点是实现简单,收敛快,但对K值选择敏感,且易受不平衡数据或大方差特征影响。k-means++通过优化初始点选择以改进原算法,而K-medoids通过选取代表点作为中心点以提高鲁棒性。
摘要由CSDN通过智能技术生成

k-means:

只能用于连续型数据,而且需要先定义k(超参数)个类别。

b4fc2b275077252b9d6ab0b08e5fcefe.png

流程:

(1) 随机选择k个样本作为初始点(中心点);

(2) 计算所有样本到这K个初始点的欧式距离,将距离K中某个初始点距离最近的样本则归为该类;

(3) 对已归类的K个簇,利用均值计算出新的中心点,并再次计算样本到新中心点的距离;

(4) 重复(2)(3),知道簇中的样本没有变化,或者距离变化很小(小于某个阈值),则结束。

优点:

(1) 原理简单,实现容易,收敛速度块;

(3) 只有一个超参数K;

(2) 只有一个超参数K;

缺点 : ​

(1) K值的选取不好把握;

(2) 数据类别不平衡或特征自身方差较大,会影响最终聚类效果;

(3) 数据类别不平衡或特征自身方差较大,会影响最终聚类效果;

k-means++算法:

k-means++改进了k个初始点的选择,将随机选择变成:

(1) 随机选择一个样本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值