今天的Coursera测验做了三次才对这说明对Precision和Recall的理解有问题

知道Precision和Recall是什么但是还是有点在区别的时候犯迷糊,加上这次的题目出的感觉有点模糊,有些描述有点模棱两可

用通俗点的话来描述Precision和Recall分别就是

Precision:判断的准确率,在你判断为真的数据中事实上就是真的比例

Recall:在所有为真的数据中你判断为真的比例,也就是你没有漏判的程度

!!一般的,我们将数据中出现少的那一种情况定义为真!!

也就是,假设我们使用了logistic regression,最后给的h(x)在[0, 1],如果我们想更准确判断,那么会有更高的Precision,以及更低的Recall;而如果我们不想漏过某个为真的数据,那么会有更高的Recall,以及更低的Precision

因为我们取得的数据有可能会是skewed class,比如数据中99%的患者没有得癌症,而只有1%的患者得了癌症,这种情况下,单单使用accuracy来衡量某个学习算法是不好的,举一个反例就是我们可以让算法直接判断所有患者都没有得癌症,这样得到的accuracy达到了99%,但是这并不是我们想要的

因此我们使用F1score = (2 * Precision * Recall) / (Precision + Recall)来衡量

用上面那个例子,99%的患者没有得癌症

1> 假设我们判断所有的患者都得了癌症,我们得到了100%的Recall因为我们没有漏过任何一个病例,另一方面,我们得到了1%的Precision,因为实际上只有1%的患者得了癌症,而总准确率为0.01

2> 假设我们判断所有的患者都没有得癌症,我们得到了0%的Recall因为我们漏掉了所有病例,另一方面,我们得到了0%的Precision因为我们所有判断得癌症的准确率是0,而我们得总准确率却有0.99

我们在用F1score衡量的时候,会希望F1score越大越好。在最理想情况下,我们准确且未漏判所有得了癌症的患者,这个时候,我们的F1score为

F1score = (2 * 1 * 1) / (1 + 1) = 1

这么理了一下感觉清晰些了

PS:什么时候把前面学的也理一下呢

Coursera是一家在线教育平台,成立于2012年,总部位于美国加利福尼亚州的山景城。该平台与全球顶尖大学和机构合作,提供超过4000门在线课程,涵盖了多个领域,如计算机科学、商业、人文、社会科学等。Coursera的课程包括了免费和付费两种类型,同时也提供了证书和学位等认证服务。 分析Coursera的优点,首先是平台的课程资源非常丰富,来自全球顶尖大学和机构,涵盖了各个领域,能够满足不同学习者的需求。其次,Coursera提供了灵活的学习方式,学生可以根据自己的时间和进度自由选择课程,进行自主学习。另外,Coursera的在线学习体验也非常好,支持多种设备和平台,同时还提供了丰富的学习工具和社交功能,方便学生进行学习和交流。 当然,Coursera也有一些缺点,首先是部分课程需要付费,尤其是认证服务,有一定的费用,可能不适合所有的学生。其次,Coursera的课程质量和难度也存在差异,有些课程可能过于简单或过于困难,需要学生自行进行筛选。最后,Coursera的学习资源主要是英文内容,对于一些非英语国家的学生来说可能存在一定的语言障碍。 综合来看,Coursera是一个非常优秀的在线教育平台,为全球学生提供了高质量的学习资源和灵活的学习方式。但是,对于不同的学生来说,需要根据自己的需求和情况进行选择和使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值