SVM二分类和多分类问题的关键指标（二）

努力学习的心子

于 2023-02-05 10:58:52 发布

阅读量522

点赞数

文章标签：分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_58222015/article/details/128888555

版权

上一篇中讲到的二分类问题关键指标（precision、recall、accuracy、F1-score）和多分类问题关键指标（Macro-average、Micro-average、Weighted-average、accuracy）可以帮助我们了解到：可以用哪些指标来大概评估分类模型的好坏。

依据个人理解，这篇即将讲到的ROC曲线、AUC面积以及P-R曲线是将这些指标进行可视化，可以进行不同模型比较和阈值的选择。

一、ROC曲线

举栗子说明：

该模型的Accuracy达到0.9，实际上该模型一个阳性都没有识别出来，由此可见，accuracy单独使用时并非一个很好的指标。

此时引入几个新的指标：

TPR就是Recall召回率。

阈值可以进行调整，计算出每个阈值对应的 FPR和TPR，并以FPR为横坐标，TPR为纵坐标连线画图，即为ROC曲线

最好的阈值的需要视情况而定的。

二、AUC面积

ROC曲线除了可以进行阈值调整之外，还可以进行模型比较，下图中有三条ROC曲线

AUC即为ROC曲线下方面积，AUC可以用来判断模型的优劣，一般来说AUC值越大越好。

上图中有三条ROC曲线，如果评估这三个模型，可以从两个方面。第一，从ROC曲线方面，越靠近左上角模型越好，因此A>B>C;第二，从AUC值方面，AUC值越大越好，因此也是A>B>C。

三、P-R曲线

通过不断调整阈值，计算每一阈值对应下的Precision和Recall，得到的曲线即为P-R曲线。

努力学习的心子

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

努力学习的心子 CSDN认证博客专家 CSDN认证企业博客

码龄3年

20: 原创

76万+: 周排名

18万+: 总排名

5万+: 访问

: 等级

291: 积分

32: 粉丝

51: 获赞

13: 评论

240: 收藏

私信

关注

热门文章

最新评论

机器学习数据集----训练集、测试集以及验证集
猪猪要学习: 验证集可以根据需要划分，不一定必须存在，它是为了调参使模型更佳，测试集是评价最终得到的模型精度。一般只有训练集和测试集就是7：3；需要训练集、验证集、测试集就是6：2：2。这个比例不是一定的，可以自己调整。
改进YOLOV5模型
CSDN-Ada助手: 恭喜您撰写了第20篇博客，标题为“改进YOLOV5模型”。您的持续创作展现了您对技术的执着和热爱，同时也为读者带来了更多有价值的内容。在接下来的创作中，或许可以考虑分享一些实际应用中的案例分析，或者与其他领域的技术进行交叉探讨，以丰富阅读体验。期待您更多的精彩内容，加油！
机器学习数据集----训练集、测试集以及验证集
wananz: 博主您好，我想问下，使用交叉验证之后，得到训练集的分数是交叉验证的平均结果吗？还是用交叉验证获取的参数训练数据，作用于训练集和测试集得到训练集和测试集的结果？
机器学习数据集----训练集、测试集以及验证集
努力学习的心子: 验证集不是必须要划分的，根据自己的需求划分即可。
机器学习数据集----训练集、测试集以及验证集
记录问题的菜鸡: 那验证集是在训练集中再次划分吗，只用train_test_split吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。