# 错误率与精度
错误率是指:分类错误的样本数占样本总数的比例
精度是指:分类正确的样本数占样本总数的比例
# (precision)查准率(准确率)、(recall)查全率(召回率)和F1
precision: 预测出的正例中有多少是真正的正例
recall:样本中有多少正例被预测出来了
真实情况 | 预测结果 | |
正例 | 反例 | |
正例 | TP(真正例) | FN(假反例) |
反例 | FP(假正例) | TN(真反例) |
在很多情形下,可以根据学习器预测结果对样例进行排序,排在前面的是学习器认为“最可能”是正例的样本,排在最后的则是学习器认为“最不可能”是正例的样本。按此顺序逐个把样本作为正例进行预测,则每次可以计算出当前的precision和recall。以precision为Y轴,以recall为X轴,就得到了P-R曲线。
#ROC与AUC
ROC: receiver operating characteristic
根据学习器的预测结果对样例进行排序,按此顺序逐个把样本作为正例进行预测,每次计算出真正例率(TPR)和假正例率(FPR),并以他们作为Y轴和X轴。
ROC曲线:
AUC: area under roc curve