在信息检索,文类问题中,我们会遇到 准确率(Precision),召回率(Recall),和F值(F-Measure又称为F-Score)。 网上对于这些定义已经有很详细的解释,我在此再写一下,用作自己复习之用
如果有雷同,请告知。
召回率(Recall) = 系统检索到的相关文件 / 系统所有相关的文件总数
准确率(Precision) = 系统检索到的相关文件 / 系统所有检索到的文件总数
相关文件即有输出的文件(不论对错)
另一种表述形式:
正确率 = 正确识别个体数 / 抽样总数(识别出个体数)
召回率 = 正确识别个体数 / 样本中该个体总数(不论是否抽取)
F值 = 正确率 * 召回率 *2 /(正确率+召回率)
这里 拿一个别人写好的例子来说明一下:
某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。Seaeagle撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:
正确率 = 700 / (700 + 200 + 100) = 70%
召回率 = 700 / 1400 = 50%
F值 = 70% * 50% * 2 / (70% + 50%) = 58.3%
正确率是评估捕获的成果中目标成果所占得比例;
召回率,顾名思义,就是从关注领域中,召回目标类别的比例;
而F值,则是综合这二者指标的评估指标,用于综合反映整体的指标。F值较高时,反应验证方法比较有效。
文章参考:
http://blog.chinaunix.net/uid-23028928-id-2567754.html