1. 引例
比如我们的香蕉中 1 表示好的,0表示坏的,有10个香蕉: gold : [ 1,1,1,1,1,0,0,0,0,0 ]
pred: [ 1,0,1,1,1,1,1,0,0,0 ]
注释:gold是现实的好坏;pred是预测的好坏。
P(Precision) 查准率:就是上面说的"准"。字面意思好理解呀,就是在预测当中查找准确个数的比例。
公式为: P = 真正预测准确的数量/预测是准确的数量 = 4 / 6
R(Recall) 查全率:就是上面的"全"。根据字面理解,在预测中看看真正预测对的占全有对的比率。
公式为:
R = 真正预测准确的数量/所有真正好的数量 = 4 / 5
F值是:
F(k) = ( 1 + k ) * P * R / ( ( k*k ) * P + R )
注释:k>0 度量了 查全率 对 查准率 的相对重要性。k>1查全率有更大影响;k<1查准率有更大影响。
在这个实例中可以表示为:k>1就是查全率有更大影响,就是好的香蕉最好都预测出来,因为你觉得不想把好的当成坏的扔点( 真可惜,我爱吃啊 ) ;k<1查准率有更大影响,就是一定要准确,省时间,省力更重要,不在乎好的香蕉当坏的扔点。
而我们常用的是F1,就是F(1)的意思,k=1,比如我们做一个分类任务,这几个类觉得都一样重要。此时:
F(1) = 2 * P * R / ( P + R )
2.公式。
3.含义
有时也用一个F1值来综合评估精确率和召回率,它是精确率和召回率的调和均值。当精确率和召回率都高时,F1值也会高。
有时候我们更加重视精确率。我们用一个参数来度量两者之间的关系。如果, 召回率有更大影响,如果,精确率有更大影响。自然,当的时候,精确率和召回率影响力相同,和F1形式一样。
查准率,百分比越高,证明此模型的效果越好,查准率反应模型判断的准确性,其补数为误判率;
查全率,百分比越高,模型效果越好,反应模型的判断的全面性,其补数为漏检率。
F1综合了P和R的结果,当F1较高时则比较说明实验方法比较理想。