分类模型评价

评价一个分类模型的好坏,我们需要一些评价指标,如Acc、Recall和Pression等,下面就和大家分享一下这三个指标。

一、几个常用术语

首先,我们先说一下几个常用术语:TP(True positives)、TN(True negatives)、FP(False positives)、FN(False negatives)
TP —— 模型预测样本是正样本,这个样本的真实结果也是正样本;比如:模型预测该客户是一个流失客户,然后实际情况是这个客户确实是一个流失掉的客户。
FN —— 模型预测样本是负样本,这个样本的真实结果也是一个负样本;比如:模型预测该客户不是一个流失客户,然后实际情况是这个客户确实不是一个流失掉的客户。
FP —— 模型预测样本是正样本,这个样本的真实结果却是负样本;比如:模型预测该客户是一个流失客户,然后实际情况是这个客户不是一个流失掉的客户。
TN —— 模型预测样本是负样本,这个样本的真实结果是正样本;比如:模型预测该客户不是一个流失客户,然后实际情况是这个客户确是一个流失掉的客户。

二、Acc、Recall和Pression的表示

如下图,我们将图中的整个矩形区域比喻为我们的训练集,且只有正类和负类,即训练集=TN+TP+FN+FP
那么我么可以用准确率来评价我们分类模型的好坏。准确率就是我们的预测值与真实值相同时的概率,即

Acc=(TP+FN)/(TN+TP+FN+FP)

但是单用准确率来平价模型的好坏有一定的局限性,如我们的数据不平衡或者类偏斜的时候,这个时候呢,我们就需要引入Recall和Pression。

Pression指的是精确率,就是说我们预测为正类中实际也为正类的比例,即

Pression=TP/(TP+FP)

Recall指的是召回率,即我们预测为正类实际上也为正类在所有真实为正类中的占比,即

Recall=TP/(TP+TN)
在这里插入图片描述
总结:在不能只用准确率来平价模型好坏时,我们就需要通过精确率和召回率来评价,但在实际应用中,要根据应用场景来选择精确率或召回率的高低来平价分类模型。

以上仅是个人的看法,希望对您有所帮助,如果有发现不妥的地方,希望可以评论区留言,我们可以进一步探讨,多谢批评指正!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值