单纯的使用Precision表示模型能力是不够的。
例如,一个垃圾邮件分类任务,正常邮件记为0,垃圾邮件记为1。
假设样本分布均匀,5个0,5个1。
但是模型非常保守,除非有确切的证据才认为是垃圾邮件,否则更倾向于分类为正常邮件。
假设它的分类结果为,8个0,2个1。
则precision高达100%,因为它认为是垃圾邮件的这两个例子确确实实本来就是垃圾邮件(太保守了)。
但它由于过于保守而放过了很多的垃圾邮件(3个),它的Recall只有40%。
所以对于垃圾分类任务来说,这个模型表现其实并不是很好。