在机器学习,深度学习等领域中。评估(Evaluation)是一个必要的工作,而评估的指标就是准确率(Accuracy),精确率(precision),召回率(recall)
准确率(Accuracy):
对于给定的测试集,分类器正确分类的数量和总数之比。
例如,一个班一共有100个人,80个男生,20个女生。现有小明要对这100个人进行分类,他将分成了50个男生,50个女生(男生全对),所以小明将30个男生判错为女生,其他70个人判断正确。则准确率(Accuracy)为70/100=0.7
但是在一些情况下,不能仅仅通过精确率来判断一个分类器是否有效。例如:在一个1万张图片的数据集中,仅仅有100个人的图片,分类器来判断数据集图片是否为人?如果分类器将多有照片都分类为 :不是人。那它的准确率有达到了9900/10000,没有任何意义。
混淆矩阵
针对二分类问题。将实例分为正类(postive)或者负类(negtive)。但是在实际分类中,会出现四种情况。
(1)实例为正类且被预测为正类,即为真正类True Positive(TP)
(2) 实例为正类但被预测为负类,即为假负类False Negative(FN)
(3)实例为负类但被预测为正类,即为假正类False Positive(FP)
(4)实例为负类且被预测为负类,即为真负类True Negative(TN)
精确率(precision)
表示被分为正例的实例中实际为正例的比例
召回率(recall):
表示为正例中预测对的与所有被预测对的比例