机器学习中经常用到这几个性能指标
官方定义:
假设原始样本中有两类,其中:
1:总共有 P个类别为1的样本,假设类别1为正例。
2:总共有N个类别为0 的样本,假设类别0为负例。
经过分类后:
3:有 TP个类别为1 的样本被系统正确判定为类别1,FN 个类别为1 的样本被系统误判定为类别 0,显然有P=TP+FN;
4:有 FP 个类别为0 的样本被系统误判断定为类别1,TN 个类别为0 的样本被系统正确判为类别 0,显然有N=FP+TN;
精确度(Precision):
P = TP/(TP+FP) ;
准确率(Accuracy)
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN);
召回率(Recall),也称为 True Positive Rate:
R = TP/(TP+FN) = 1 - FN/T;
自己理解:
1. 召回率 Recall :也叫查全率,正确预测某项=确实是A/把A预测为
2.精确率 Precision: 也叫查准率,即 确实是A/预测是A
3.准确率 Accuracy: 预测正确/所有
具体例子说明: