数据挖掘、机器学习和推荐系统中的评测指标—准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F值(F-Measure)
混淆矩阵
True Positive(真正,TP):将正类预测为正类数
True Negative(真负,TN):将负类预测为负类数
False Positive(假正,FP):将负类预测为正类数为误报 (Type I error)
False Negative(假负,FN):将正类预测为负类数为漏报 (Type II error)
1、准确率(Accuracy)
准确率(accuracy)计算公式为:
总预测正确的数目与总预测的数目之比
2、精确率(Precision)
精确率(precision)定义为:
表示被分为正例的示例中实际为正例的比例。
3、召回率(recall)
召回率是覆盖面的度量,度量有多个正例被分为正例
recall=TP/(TP+FN)
4、综合评价指标(F-Measure)
P和R指标有时候会出现的矛盾的情况,这样就需要综合考虑他们,最常见的方法就是F-Measure(又称为F-Score)。
F-Measure是Precision和Recall加权调和平均:
当参数α=1时,就是最常见的F1,也即
可知F1综合了P和R的结果,当F1较高时则能说明试验方法比较有效。