主要内容:机器学习中常见的几种评价指标,它们各自的含义和计算(注意本文针对二元分类器!)
1、混淆矩阵
True Positive(真正,TP):将正类预测为正类的数目
True Negative(真负, TN):将负类预测为负类的数目
False Positive(假正,FP):将负类预测为正类的数目(Type I error)
False Negative(假负,FN):将正类预测为负类的数目(Type II error)
2、精确率(Precision)
精确率表示被分为正例的实例中实际为里正例的比例。
3、召回率(Recall)
召回率表示所有实际为正例的实例被预测为正例的比例,等价于灵敏度(Sensitive)
4、综合评价指标(F-Measure)
Precision和Recall有时会出现矛盾的情况,为了综合考虑他们,我们常用的指标就是F-Measure,F值越高证明模型越有效。
F-Measure是Precision和Recall的加权调和平均。
当参数α=1时,就是我们最常见的F1。
5、ROC曲线和AUC(Area Under Curve)