适合初学者的神经网络 实战 理论 实践(6)
[易懂]如何理解论文中的那些评估方法性能指标概念名词{召回率 ROC AUC 交叉验证}
首发于:知乎专栏《适合初学者的机器学习神经网络理论到实践》
假设现在我们论文是要识别垃圾邮件。将邮件分类为垃圾邮件和非垃圾邮件。
好了接下来通过垃圾邮件这个例子说明别人论文中常常出现的评估方法性能的概念名字是什么意思。
假如我输入了5个数据到模型,那么模型会有相应5个分类结果出来。
邮件编号 模型分类结果 实际标签
邮件1 垃圾邮件 垃圾邮件
邮件2 非垃圾邮件 垃圾邮件
邮件3 垃圾邮件 非垃圾邮件
邮件4 垃圾邮件 垃圾邮件
邮件4 非垃圾邮件 非垃圾邮件
TP FP TN FN
这个四个词都是表示的是数字,四种情况下的样本数目。比如True Positive (TP)表示邮件分类正确了,并且模型判断它是垃圾邮件(Positive)样本的个数。统计这些数目就可以统计准确率和召回率这些比率。一定要先理解这个再看后面的准确率和召回率。
这四个词每个词都是两个单词的首字母缩写而成。其中第一个字母{T代表True、F代表False},这个是表明是分类对了还是分类错了。第二个字母{P代表Positive、N代表Negative},这个代表模型它输出结果是什么。