轮廓系数 是用来 判断 “聚类效果”的 一个指标。
轮廓系数的核心思想是判断:类间距离 与 类内距离 的相对大小,如果 类间距离 > 类内距离,则说明 聚类结果好,反之,则不好。
轮廓系数 的 这种思想 与 “Fisher线性判别”很相似,都是判定 “类间距离” 与 “类内距离” 的相对大小。不同的是,轮廓系数 是用来 衡量“聚类结果”好坏的,而Fisher线性判别中“类间,类内距离比较”是 用来“将原始维度数据 降到 一维线性空间”的,这种降维行为有一个前提,即:使得 各类别之间 能够在 降维后的 空间 被很好的 区分开来。
参考博文:聚类评估算法-轮廓系数(Silhouette Coefficient )