引言
聚类是一种无监督学习方法,评价指标和有监督学习不太一样,而且很多人在建模完成后不能重视对聚类结果的评估。
本文对聚类评估指标进行了总结,并讨论了各统计软件中已有的评估指标。
1 聚类方法论
聚类的性能度量亦称聚类‘有效性指标’,对聚类结果通过某种性能度量来评估其好坏;
明确了最终将要使用的性能度量,则可以直接将其作为聚类过程的优化目标。
2 两类聚类性能度量
2.1 外部指标:将聚类结果与某个‘参考模型’进行比较
1). Jaccard系数
2). FM指数(Fowlkes and Mallows index)
3). Rand指数(Rand Index)
4). 互信息法