1123day6

1.简述kmeans流程

随机选择k个结点作为聚类中心,依次计算所有结点到距离中心的距离,将新的结点划分到与其最近的聚类中心所在的簇,更新聚类中心点,重复次过程,直至所有的数据所属的簇不在发生变化为止
2.kmeans对异常值是否敏感?为何? 

敏感,因为K-mean需要计算距离,异常值会导致距离变化,从而分类错误
3.如何评估聚类效果 

兰德系数

调整兰德系数

轮廓系数
4.超参数k如何选择? 

肘部法则:遍历不同的K,计算代价函数,并画出代价函数变化趋势,选择使代价函数变平缓的点所对应得K值
5.kmeans算法的优缺点(各说三个) 

优点:原理简单,易于实现;可解释性强;参数少

缺点:计算量大,速度慢;数据量大时不适用;对异常值敏感

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值