目录
0 写在前面
机器学习强基计划聚焦深度和广度,加深对机器学习模型的理解与应用。“深”在详细推导算法模型背后的数学原理;“广”在分析多个机器学习模型:决策树、支持向量机、贝叶斯与马尔科夫决策、强化学习等。强基计划实现从理论到实践的全面覆盖,由本人亲自从底层编写、测试与文章配套的各个经典算法,不依赖于现有库,可以大大加深对算法的理解。
1 性能指标
在有监督学习中,性能度量有TPR
、FPR
、AUC
等,但这些基于标签的度量不适于聚类这种无监督学习。在无监督学习中,性能度量分为两种:
- 外部指标:将聚类结果与某个参考模型进行比较,参考模型通常由领域专家给出;
- 内部指标:直接考察聚类结果而不利用任何参考模型;
下面分别介绍两种指标对应的度量方法,下述性能指标在区间