聚类,是无监督学习的代表,将数据集D划分成了若干个不相交的子集,称为簇,我们总体的目标是“簇间相似性越低越好,簇内相似性越高越好”。
1.性能度量指标——外部指标
外部指标:聚类结果与某个“参考模型”进行比较。
对数据集,假设通过聚类划分为
,参考模型的划分为:
,令
和
分别表示
和
的标记。则令
聚类,是无监督学习的代表,将数据集D划分成了若干个不相交的子集,称为簇,我们总体的目标是“簇间相似性越低越好,簇内相似性越高越好”。
外部指标:聚类结果与某个“参考模型”进行比较。
对数据集,假设通过聚类划分为
,参考模型的划分为:
,令
和
分别表示
和
的标记。则令