准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。
1.正确率=提取出的正确信息条数/提取出的信息条数
2.召回率=提取出的正确信息条数/样本中的信息条数。
3.F值=正确率*召回率*2/(正确率+召回率)
假设一共有10篇文章,里面4篇是你要找的。根据你某个算法,你认为其中有5篇是你要找的,但是实际上在这5篇里面,只有3篇是真正你要找的。
那么你的这个算法的precision是3/5=60%,也就是,你找的这5篇,有3篇是真正对的。
这个算法的recall是3/4=75%,也就是,一共有用的这4篇里面,你找到了其中3篇。
当然希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。比如极端情况下,我们只搜出了一个结果,且是准确的,那么Precision就是100%,但是Recall就很低;而如果我们把所有结果都返回,那么Recall会是100%,Precision就会很低。