聚类学习-轮廓系数

轮廓系数是评估聚类效果的一种指标,介于-1到1之间,值越大表示聚类效果越好。在scikit-learn中,可以使用`silhouette_score`计算平均轮廓系数,而`silhouette_samples`返回所有样本的系数。文章通过实例展示了如何使用KMeans和轮廓系数来分析不同簇数量的效果。
摘要由CSDN通过智能技术生成

定义

轮廓系数(silhouette coefficient) 结合了凝聚度和分离度,其计算步骤如下:

  1. 对于第 i 个对象,计算它到所属簇中所有其他对象的平均距离,记 ai (体现凝聚度)
  2. 对于第 i 个对象和不包含该对象的任意簇,计算该对象到给定簇中所有对象的平均距离,记 bi (体现分离度)
  3. 第 i 个对象的轮廓系数为 si = (bi-ai)/max(ai, bi)  /
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值