一.准确率 - accuracy
这个好理解,就是分类正确的样本数占样本总数的比例,但在二分类且正反例不平衡的情况下,这个基本没有参考价值,举个栗子:
在测试集里,有100个sample,99个反例,只有1个正例。如果我的模型不分青红皂白对任意一个sample都预测是反例,那么我的模型的accuracy是 正确的个数/总个数 = 99/100 = 99%,你拿着这个accuracy高达99%的模型屁颠儿屁颠儿的去预测新sample了,而它一个正例都分不出来,有意思么。。。
二.精确率 - precision和召回率 - recall
精确率P=TP/(TP+FP) 表示在预测结果为正例的样本中,有多少是真正的正例。
召回率R=TP/(TP+FN) 表示在所有真正为正例的样本中,有多少被预测出来。
精确率和召回率是一对相对矛盾的度量!
F1值是精确率和召回率的调和均值,即F1=2PR/(P+R),相当于精确率和召回率的综合评价指标。
另外还有Fα值,为F1值的变体, Fα=(α^2+1)PR/(α^2 P+R) ,利用α给P和R赋予不同的权重,若α=1则为F1值。α>1时精确率有更大影响;α<1时召回率有更大影响。