一: 理解FP,FN,TP,TN
刚接触这些评价指标时,感觉很难记忆FP,FN,TP,TN,主要还是要理解,理解后就容易记住了
P(Positive)和N(Negative) 表示模型的判断结果
T(True)和F(False) 表示模型的判断结果是否正确
比如FP:模型的判断结果为正例§,但实际上这个判断结果是错误的(F),连起来就是假正例
以此类推:
FP:假正例
FN:假负例
TP:真正例
TN:真负例
二:理解准确率(Accuracy),召回率(Recall),精确率(Precision),F1-score
- 准确率(Accuracy):这三个指标里最直观的就是准确率: **模型判断正确的数据(TP+TN)**占总数据的比例
Acc= (TP+TN)/(TP+TN+FP+FN) - 召回率(Recall):即正确预测为正TP的占全部实际为正(TP+FN)的比例。个人理解:真正正确的占所有实际为正的比例
Recall=TP/(TP+FN) - 精确率(Precision):即正确预测为正(TP的占全部预测为正(TP+FP)的比例。个人理解:真正正确的占所有预测为正的比例
Precision=TP/(TP+FP)
区分好召回率和精确率的关键在于:针对的数据不同,召回率针对的是数据集中的所有正例,精确率针对的是模型判断出的所有正例 - F1值(H-mean值)。F1值为算数平均数除以几何平均数,且越大越好,将Precision和Recall的上述公式带入会发现,当F1值小时,True
Positive相对增加,而false相对减少,即Precision和Recall都相对增加,即F1对Precision和Recall都进行了加权
F1=1/Recall+1/Precision
[参考文献】
https://blog.csdn.net/littlehaes/article/details/83278256
https://blog.csdn.net/u013063099/article/details/80964865