今天的Coursera测验做了三次才对这说明对Precision和Recall的理解有问题

最新推荐文章于 2024-06-11 00:33:26 发布

xykaiku

最新推荐文章于 2024-06-11 00:33:26 发布

阅读量2.2k

点赞数

分类专栏： machine-learning 文章标签：机器学习 machine-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xykaiku/article/details/66548766

版权

machine-learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

知道Precision和Recall是什么但是还是有点在区别的时候犯迷糊，加上这次的题目出的感觉有点模糊，有些描述有点模棱两可

用通俗点的话来描述Precision和Recall分别就是

Precision：判断的准确率，在你判断为真的数据中事实上就是真的比例

Recall：在所有为真的数据中你判断为真的比例,也就是你没有漏判的程度

!!一般的，我们将数据中出现少的那一种情况定义为真!!

也就是，假设我们使用了logistic regression，最后给的h(x)在[0, 1]，如果我们想更准确判断，那么会有更高的Precision，以及更低的Recall；而如果我们不想漏过某个为真的数据，那么会有更高的Recall，以及更低的Precision

因为我们取得的数据有可能会是skewed class，比如数据中99%的患者没有得癌症，而只有1%的患者得了癌症，这种情况下，单单使用accuracy来衡量某个学习算法是不好的，举一个反例就是我们可以让算法直接判断所有患者都没有得癌症，这样得到的accuracy达到了99%，但是这并不是我们想要的

因此我们使用F1score = (2 * Precision * Recall) / (Precision + Recall)来衡量

用上面那个例子，99%的患者没有得癌症

1> 假设我们判断所有的患者都得了癌症，我们得到了100%的Recall因为我们没有漏过任何一个病例，另一方面，我们得到了1%的Precision，因为实际上只有1%的患者得了癌症，而总准确率为0.01

2> 假设我们判断所有的患者都没有得癌症，我们得到了0%的Recall因为我们漏掉了所有病例，另一方面，我们得到了0%的Precision因为我们所有判断得癌症的准确率是0，而我们得总准确率却有0.99

我们在用F1score衡量的时候，会希望F1score越大越好。在最理想情况下，我们准确且未漏判所有得了癌症的患者，这个时候，我们的F1score为

F1score = (2 * 1 * 1) / (1 + 1) = 1

这么理了一下感觉清晰些了

PS：什么时候把前面学的也理一下呢

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。