基本指标
评价模型的常用方法——精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么?
假如数据可以被分为好数据(1)和坏数据(0),那么根据实际情况和评价结果的不同,总共能将结果分为四种情况:
True Positive(TP):实际为好数据,判定结果为好数据
False Positive(FP):实际为坏数据,判定结果为好数据
True Negative(TN):实际为坏数据,判定结果为坏数据
False Negative(FN):实际为好数据,判定结果为坏数据
注意,TP,FP,TN,FN的选定取决于0和1的情况,而不是数据本身的好坏。0和1的选定要看你自己想得到好数据还是坏数据。这里就认为好数据为1。
精确率(Precision)
在所有预测为好数据的结果中间,实际确实为好数据的占比(预测正确)。
P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FP