Q4. Explain what precision and recall are. How do they relate to the ROC curve.
Q4. 解释一下什么是准确率和召回率,他们与ROC曲线有什么关系.
答案:
准确度P 召回率R
准确率:你的预测有多少是对的
召回率:正例里你的预测覆盖了多少
看懂这个表走天下:
ROC曲线(Receiver Operating Characteristic)
ROC 曲线是表示正例和负例间关系,常常用于对二值化的分类模型啦。但是通常面对于大量的数据,用 准确度P-召回率R (PR) 曲线能更具有代表性。
ROC横坐标: True Positive Rate (TPR) = TP / [ TP + FN]
ROC纵坐标: False Positive Rate (FPR) = FP / [ FP + TN]
反正我做模型后面用来校验,看的是PR图,不看ROC图,PR曲线图看上去舒服很多,理解直观。
例子解释
有100封邮件,真正垃圾邮件的有30封,我的贝叶斯模型找到40封垃圾文件,其中5封垃圾邮件识别为有用文件。那