机器学习基础梳理/模型评估指标

石头猿rock

已于 2023-12-02 21:27:48 修改

阅读量445

点赞数

分类专栏：统计机器学习 NLP面经文章标签：机器学习

于 2022-09-21 21:37:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42887772/article/details/126961547

版权

NLP面经同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

统计机器学习

6 篇文章 0 订阅

订阅专栏

混淆矩阵

在这里插入图片描述

准确率：预测对的样本在所有样本中的比例，适用于多分类
$\frac {TP+TN}{TP+TN+FN+FP}$
准确率的局限性： 当样本不平衡时，用准确率评估会失效。例如正负样本为9：1，模型全都预测成正样本，准确率为90%
精确率和召回率只适用于二分类
精确率：预测对的样本在预测值为真中的比例
$\frac{TP}{TP+FP}$
召回率：预测对的样本在真实值为真中的比例
$\frac{TP}{TP+FN}$
我们希望精确率和召回率都尽量高，但精确率和召回率是此消彼长的，无法做到双高；如果同时考虑两者，只能找到一个平衡点来兼顾精确率和召回率，F1-score
F1-score是精确率和准确率的调和平均值
$(1+\beta^2)\frac{precision*recall}{\beta^2precision+recall}$
如果我们比较注重precision，应该调小beta；注重recall，调大beta
不同的业务注重不同的指标，比如搜索某个内容，我们在保证召回率的前提下，提升精确率；在癌症检测，金融欺诈，地震监测方面，我们在保证精确率的情况下，提高召回率。
样本不平衡的情况下，选择F1或ROC曲线作为评估指标。

P-R曲线：

P-R曲线的纵轴是精确率，横轴是召回率；P-R曲线上的每一个点都代表着在不同的阈值下的精确率和召回率。
阈值不同，导致混淆矩阵不同，导致精确率和召回率也不同，这里的阈值指的就是softmax分类的阈值。
在这里插入图片描述

AUC

ROC曲线下的面积，ROC曲线的x轴是FP假阳率，y轴是TP真阳率

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

石头猿rock 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。