区分Recall和Precision
召回率和准确率是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标。
召回率:Recall,又称“查全率”——还是查全率好记,也更能体现其实质意义。
准确率:Precision,又称“精度”、“正确率”。
以检索为例,可以把搜索情况用下图表示:
相关 | 不相关 | |
---|---|---|
检索到 | A | B |
未检测到 | C | D |
A:检索到的,相关的 (搜到的也想要的)
B:检索到的,但是不相关的 (搜到的但没用的)
C:未检索到的,但却是相关的 (没搜到,然而实际上想要的)
D:未检索到的,也不相关的 (没搜到也没用的)
精确率(precision)= A/(A+B)
精确率追求的是找到准确的信息,不相关的信息越少越好
召回率(recall)= A/(A+C)
召回率追求的是数量,信息越多越好
区分Accuracy和Precision和Recall
真 | 假 | |
---|---|---|
真(预) | TP | FP |
假(预) | FN | TN |
合计 | P | N |
准确率(Accuracy) = (TP+FN)/(P+N)
精确率(Precision) = TP/(TP+FP)
召回率(Recall) = TP/(TP+FN)
Missing Alarm and False Alarm
导弹 | 干扰弹 | |
---|---|---|
导弹(预) | TP | FP |
干扰弹(预) | FN | TN |
合计 | P | N |
漏警概率 (missing alarm) = FN/P
虚警概率(false alsrm)=TP/(TP+FP)
PS:1、 MA=1-R 2、 FA=1-P