精度(accuracy)和错误率(error)
这个最常用,用在常见的分类任务中,比如有鸡,鸭,鹅,狗,猫若干,让模型一一回答他们的类别,见到扁嘴脖子长还会嘎嘎叫的,回答为鸭,预测正确,否则回答错误。最后 (回答正确个数) 除以 (鸡鸭鹅狗猫总数) = 精度.
错误率则是1-精度
尽管精度或错误率能够衡量模型的分类能力,但很多场景下精度高并不代表这个模型就好。举个例子,比如在病情诊断过程中,需要模型判断体检样片呈现的是“健康”,“早期”,还是“晚期”三个情况,该模型能够到达95%的精度,即给100个样片,能够保证误判控制在5个以内。看似很不错,但是体检有一个特点,就是大多数人都是健康的,即我哪怕瞎猜都健康也能达到至少80%的精度,但事实上漏掉的那些才是真正important的,所以我们进一步需要查准率和查全率这样的指标。
查准率(precision)和查全率(recall)
先搬一段周志华书中的解释,其实已经