对机器学习模型进行评估,不仅需要有效的实验评估方法,还需要有衡量模型泛化能力的评价指标,在这里总结一下常用的机器学习模型的性能度量方法,总结不完善的地方欢迎大家留言补充。
以二分类为例,首先给出分类结果混淆矩阵:
真实情况 | 预测结果 | |
正例 | 反例 | |
正例 | TP | FN |
反例 | FP | TN |
TP:将正例预测为正例数;
FN:将正例预测为负例数;
FP:将负例预测为正例数;
TN:将负例预测为负例数;
一准确率
A c c u r a c y = T P + T N T P + F N + F P + T N Accuracy=\frac{TP+TN}{TP+FN+FP+TN} Accuracy=TP+FN+FP+TNTP+TN
二精确率(查准率)
P = T P