一.根据真实结果和预测结果将所有测试集分为四类
1.TP(true positive):真阳。数据本身是阳性的(可能不是这么叫,就是说这个数据是需要选择标识出的数据),同时也被模型正确的判断为正类,因此是真的真的阳性。
2.FP(false positive):假阳。数据本身是阴性的(这个数据是不应该被选择或标识出来的),但是模型错误的将它判断为阳性,因此是假的阳性。
3.TN(true negative):真阴。数据本身是阴性的,而且模型正确的将它判断为阴性,因此是真正的阴性。
4.FN (false negative):假阴。数据本身是阳性的,但是模型错误的将它判断为阴性,因此是假的阴性。
关于这里所谓的阳性阴性,是相对的,举个例子:有一堆图片,任务是找出其中有小狗的图片。此时,有小狗的图片就是阳性的,其他图片就是阴性的。
Precision:判断预测出来的,找出来的目标(也就是模型认为是阳性的数据)准不准,这里面真正的阳性占多少。 TP/(TP+FP)
Accuracy: 判断这个模型的正确率怎么样,也就是正确判断出来是阴性和正确判断出来是阳性的数据占测试集的多少。 (TP+TN)/ (TP + TN +FP + FN)
Recall:所有的阳性数据有多少被找出来了。 TP / (TP + FN)