本文重点
如上所示,我们学习了查准率和召回率,本文我们将学习真阳性率和假阳性率,学会这个对将来构建ROC曲线非常有帮助
真阳性率和假阳性率
假如使用测试集来评估一个分类模型(二分问题):所以样本实际值有y=0或者y=1两种情况,而样本预测值也有这两种情况(y=0,y=1),我们将算法预测的结果分成四种情况:
1. 正确肯定(True Positive,TP):预测为真,实际为真
2. 正确否定(True Negative,TN):预测为假,实际为假
3. 错误肯定(False Positive,FP):预测为真,实际为假
4. 错误否定(False Negative,FN):预测为假,实际为真
其中FPR(假阳性率)=FP/N,TPR(真阳性率)=TP/P。
N是真实的负样本(y=0)的数量,P是真实的正样本(y=1)的数量。