因为算法是没办法保证100%正确的,所以就需要有一些指标,来评估算法的好坏,度量此算法是否能很好的完成你设定的任务。
那在不同的任务中,就需要设定不同评价指标,比如
场景一
人脸识别算法用于门禁系统,如果识别到是名单上的人员,就开门,如果不是,就不开门。
在此场景中,会出现3种出错的可能:
1.不在名单人的人员,但识别成名单上的人员,开门了
2.名单上的人员A识别成了名单上的人员B,开门了
3.名单上的人员,没有识别出来,不开门
这种任务,一般会用2种评价指标来衡量任务的完成情况,
1.精确率 (Precision)
Precision = TP/(TP+FP)
此指标表示放行的人中有多少是正确的,如果精确率较低,则表示统计到的进入人员是不准确的,不应该放行的人也放行了。
其中
TP 为 TruePositive,真正值,表示实际值为正,预测值也为正。在此案例中,则表示正确识别出来名单中的具体人员,实际上是人员A,也正确识别成了人员A。
FP 为 FalsePositive,假正值,表示实际值为负,预测值为正。在此案例中,则表示识别为名单的人员,但实际并不是这个人,上面说的第1、2种错误都是FalsePositive。
2.召回率(Recall)
召回率 Recall