F1-score
综合评估分类模型,取值0-1之间
F1-score综合考虑Precision和Recall,是P和R加权调和平均,当精确率和召回率都高时,F1-score也会高:
化简得到
如果类别为多类,则F1-score 求均值:(或进行加权平均,权重可以根据每一类的样本数来定)
F值(F-Measure)
但有时候我们对精确率和召回率并不是一视同仁,比如在医疗领域,我们不希望遗漏掉任何一位患者,所以应该更加重视召回率。我们用一个参数β来度量两者之间的关系,得到以下式子,是对P和R加权调和均值(不一定是平均),即F值(F-Measure)或称Fβ值:
如果β>1, 召回率有更大影响,如果0<β<1,精确率有更大影响。
当β=1的时候,精确率和召回率影响力相同,即F1-score
详细可参考