ROC曲线和PR曲线

最新推荐文章于 2024-09-09 21:55:53 发布

Birdy458

最新推荐文章于 2024-09-09 21:55:53 发布

阅读量87

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_63438936/article/details/133987299

版权

一、模型评估

当评估机器学习模型时，我们希望了解模型的性能和预测能力。以下是一些常见的机器学习模型评估指标：

1. 准确率（Accuracy）：模型正确预测的样本数占总样本数的比例。
2. 精确率（Precision）：模型预测为正例的样本中，实际为正例的比例。
3. 召回率（Recall）：实际为正例的样本中，模型预测为正例的比例。
4. F1 分数（F1 Score）：精确率和召回率的加权平均值，用于综合评估模型的性能。
5. ROC 曲线（Receiver Operating Characteristic curve）：以真正例率（True Positive Rate）为纵轴，假正例率（False Positive Rate）为横轴，绘制的曲线。
6. AUC（Area Under the Curve）：ROC 曲线下的面积，用于评估分类器的性能。
7. 混淆矩阵（Confusion Matrix）：展示模型预测结果与实际结果的对比，包括真正例、假正例、真反例和假反例。

二、ROC曲线绘制

1、什么是ROC曲线

ROC曲线，即受试者工作特征曲线，主要用来评价某个指标对两类被试的效果，以及寻找最佳的指标临界值使得分类效果最好。

2、绘制ROC曲线代码

3、图像结果

三、PR曲线绘制

1、什么是PR曲线

召回率是指模型正确预测出的正样本占总正样本的比例，计算公式为：召回率 = TP / (TP + FN)，其中FN表示假负例（模型预测为负样本的样本中实际为正样本的数量）。

PR曲线通过改变分类模型的阈值，计算出一系列准确率和召回率的值，并以准确率为横坐标，召回率为纵坐标进行绘制。PR曲线越靠近左上角，表示模型性能越好。

2、绘制PR曲线代码

3、图像结果

4、说明

其中，y_true为样本实际的类别，1为正例，0为反例；y_scores为阈值。precision_recall_curve函数可以计算出不同阈值下的精确率和召回率，返回的precision、recall和thresholds分别为精确率、召回率和阈值。最后使用matplotlib.pyplot库中的plot函数绘制PR曲线图并显示。

四、ROC曲线和PR曲线的区别

纵坐标不同：ROC曲线以真正例率为纵坐标，以假正例率为横坐标；PR曲线以查准率为纵坐标，以召回率为横坐标。
数据不平衡问题：如果正负样本严重不平衡，ROC曲线可以更好地衡量分类器的性能，因为ROC曲线主要关注的是假正例率。相比之下，PR曲线能更好地反映分类器在正例的识别上的性能。
相对性能评估：如果要比较不同分类器的性能，ROC曲线更具优势。ROC曲线上的AUC值可以用来比较不同模型的分类能力；而在PR曲线上，AUC值比较时可能会受到样本不平衡的影响，使得评估变得复杂。

总而言之，ROC曲线主要适用于样本不平衡的问题和相对性能评估，而PR曲线则更适合于处理正负样本不平衡的问题和更关注正例识别性能的情况。在具体应用中，选择使用哪种曲线取决于具体问题和关注的性能指标。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
ROC曲线和PR曲线

ROC曲线，即受试者工作特征曲线，主要用来评价某个指标对两类被试的效果，以及寻找最佳的指标临界值使得分类效果最好。召回率是指模型正确预测出的正样本占总正样本的比例，计算公式为：召回率 = TP / (TP + FN)，其中FN表示假负例（模型预测为负样本的样本中实际为正样本的数量）。PR曲线通过改变分类模型的阈值，计算出一系列准确率和召回率的值，并以准确率为横坐标，召回率为纵坐标进行绘制。PR曲线越靠近左上角，表示模型性能越好。
复制链接

扫一扫

Birdy458 CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

152万+: 周排名

27万+: 总排名

2307: 访问

: 等级

120: 积分

33: 粉丝

38: 获赞

5: 评论

37: 收藏

私信

关注

热门文章

最新评论

机器学习环境搭建
CSDN-Ada助手: 恭喜你开始写博客了！搭建机器学习环境是一个很不错的开始，希望你可以分享更多关于机器学习的知识和经验。接下来，建议你可以尝试写一些关于机器学习算法原理或实际应用的内容，这样可以让读者更加深入地了解这个领域。加油！期待你的更多精彩内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
支持向量机
CSDN-Ada助手: 恭喜您发布了关于支持向量机的博客！您对这一主题的深入探讨让我受益匪浅。希望您能继续分享更多关于机器学习和数据分析的知识，或许可以考虑结合实际案例进行分析，让读者更易于理解和应用这些概念。期待您的下一篇精彩文章！
朴素贝叶斯算法
CSDN-Ada助手: “恭喜您写了第5篇博客！朴素贝叶斯算法是一个非常有趣的主题，您的解释和分析都很清晰明了。希望您可以继续保持创作的热情，同时也建议您可以尝试探讨一些实际应用的案例，或者结合其他算法进行比较分析，这样可以为读者提供更多的参考价值。期待您更多的精彩内容！”
KNN算法实践
CSDN-Ada助手: 非常棒的博客！你对KNN算法的介绍非常清晰和详细。我鼓励你继续写作，分享更多关于机器学习和数据分析的内容。除了KNN算法本身，你可以考虑扩展一些相关的知识和技能。比如，你可以介绍一下KNN算法在特征选择和特征工程中的应用，以及如何优化KNN算法的性能。此外，你还可以探讨KNN算法在图像识别、推荐系统和异常检测等领域的应用。这些扩展内容将使读者更全面地了解KNN算法的应用场景和潜力。再次感谢你的分享，期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
ROC曲线和PR曲线
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“ROC曲线和PR曲线”非常吸引人。通过您的博客，我对这两个概念有了更深入的了解。您的解释非常清晰，让我能够更好地理解这两个概念之间的区别和应用场景。我期待着您未来更多的创作，并希望您能继续分享关于数据分析和机器学习的相关知识。也许，下一步您可以探索一些实际案例，展示这些曲线如何在实际问题中发挥作用。无论如何，我相信您会继续以谦虚的态度不断进步。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。