在学习机器学习算法过程中,在学习评价标准(accuracy, precision, recall)内容的时候,记录一下自己遇到的问题。
在网上查找准确率,召回率,一般会发现两套描述。一套是对于信息检索的,一套是对于分类问题的。
一、 信息检索问题
Recall 查全率,也叫召回率,通用。
Precision 查准率,(强调,这里记汉语容易弄错,记英文词不会错。我查到的资料是,在信息检索领域中,查准率也叫准确率;而在分类领域中,查准率叫精确率)
信息检索中概念公式:
查全率(Recall) = 系统检索到的相关文件 / 系统所有相关的文件总数
查准率(Precision)= 系统检索到的相关文件 / 系统所有检索到的文件总数
例子
假如某个班 全部 男生80人,女生20人,共计100人。
目标是找出所有女生。
现在 挑出50人,其中20人是女生(对),其他30个人是男生(错)
这个问题中,
目的是找寻女生, 因此相关就是总女生20人,不相关就是总男生80人。
挑出来的即检索挑出到的, 挑