只使用准确率作为评估指标的缺陷

问题:某公司准备对奢侈品使用用户精准投放广告。他们搜集了网上用户的数据,将这些数据作为训练集和测试集,使用分类器将用户分类为奢侈品用户和非奢侈品用户。该分类器的准确率达到了95%,但是在实际投放的时候,还是将广告投放给了许多非奢侈品用户。造成原因的分析如下:

因为只使用准确率作为评估指标,所以样本的分布对结果影响很大。举例来说:如果样本中负样本占95%,正样本占5%,那么如果将正样本全部误分类为负样本,准确率也可以达到95%。

实际上我们使用的准确率是两个准确率的加权和:将正样本分类为正样本和将负样本分类为负样本。权重是正样本和负样本的个数。

开始提到的问题中:虽然整体的准确率很高,但是将正样本分类为正样本的准确率为0。这样的话训练得到的分类器预测的正样本几乎跟随机的性能差不多,随机预测得到的正样本中有一半是负样本,这就解释了开始的案例中出现的在实际投放时将广告投放给了许多非奢侈品用户的原因。

上面分析的数学式子解释待更新。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

skj1995

你的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值