-
评估逻辑回归的指标
- 正确率与召回率
正确率与召回率(Precision & Recall)是广泛应用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。
一般来说,正确率就是检索出来的条目有多少是正确的,召回率就是所有正确的条目有多少被检索出来了。
F1值=2 ∗正确率∗召回率/(正确率+召回率)。是综合上面二个指标的评估指标,用于综合反映整体的指标。这几个指标的取值都在0-1之间,数值越接近于1,效果越好。
- 举例
某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。
撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标
分别如下:
正确率= 700 / (700 + 200 + 100) = 70%
召回率= 700 / 1400 = 50%
F值= 70% * 50% * 2 / (70% + 50%) = 58.3%
某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。
撒一大网,逮着了所有的鱼虾鳖:
正确率= 1400 / (1400 + 300 + 300) = 70%
召回率= 1400 / 1400 = 100%
F值= 70% * 100% * 2 / (70% + 100%) = 82.35%
- 我们希望检索结果Precision越高越好,同时Recall也越高越好,但事
实上这两者在某些情况下有矛盾的。比如极端情况下,我们只搜索出
了一个结果,且是准确的,那么Precision就是100%,但是Recall就
很低;而如果我们把所有结果都返回,那么比如Recall是100%,但是
Precision就会很低。
因此在不同的场合中需要自己判断希望Precision比较高或是Recall比
较高。
- 综合评价指标
正确率与召回率指标有时候会出现的矛盾的情况,这样就
需要综合考虑他们,最常见的方法就是F-Measure(又称
为F-Score):
当? =1时,就是常见的F1指标: