含义
轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式。
轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优。
计算步骤
1)对于簇中的每个向量,分别计算它们的轮廓系数。
对于其中的一个点 i 来说:
计算 簇内不相似度a(i) :i向量到同簇内其他点不相似程度的平均值,体现凝聚度
计算 簇间不相似度b(i) :i向量到其他簇的平均不相似程度的最小值,体现分离度
那么第i个对象的轮廓系数就为:
si接近1,则说明样本i聚类合理;si接近-1,则说明样本i更应该分类到另外的簇;若si 近似为0,则说明样本i在两个簇的边界上。
2)将所有点的轮廓系数求平均,就是该聚类结果总的轮廓系数。