算法的离线评估

本文探讨了在项目开发中如何通过离线评估确保算法有效性,重点关注GAUC作为评估指标的应用及其注意事项,强调选择合适的离线评估指标对于算法迭代的重要性。文章解释了GAUC相对于AUC的优势,并提醒在选择group粒度和对比不同算法策略时的正确方法。
摘要由CSDN通过智能技术生成

背景

  • 在平时做项目的过程中,算法迭代是至关重要的,如果能准确找到算法的优化点和优化空间,那么可以使得最终的效果有很大的提升。
  • 在实际的项目中,一个算法模块的上线可能会涉及算法,引擎,前段,测试等等一堆模块的修改,如果再加上链路的过长,跨部门跨团队的协同开发和联调不可避免,且非常耗时间,一旦上线发现效果不符合预期,会浪费大量的人力时间去排查和解决问题。
    • 这种情况需要我们算法端的同学保证算法的有效性,能够保证如果效果不符合预期,排查范围可以锁定在工程链路上,而不是算法逻辑上;
    • 尽量减少有个新算法新想法先扔到线上看看效果,视效果再继续迭代的想法,离线做好算法的评估,对最终算法效果又更强的把控,离线评估确保有正向价值的算法再退到线上;
    • 算法模块尽量抽象出现,使得算法迭代的过程减小其他模型涉及的改动,最好是其他模块零改动。

如果做好有效的离线评估呢?

离线评估重要的是选择一个靠谱的离线评估指标,选对并且用对了评估指标,可以让算法的迭代有明确的优化方向,离线的提升能够预期带来实际线上效果的提升。

GAUC

AUC指标相信对机器学习算法熟悉的人都比较了解,是非常常用的模型评价指标,在很多二分类的问题中是最重要的算法模型评估依据。以广告场景的ctr预估问题为例,ctr预估本质上是对一个流量是否会发生点击行为的一个预测,点击or不点击就是模型想给出的答案,也是一个二分类问题,一般地,算法会给一个流量打上一份score分,如果score分超过某个threshold,则判断为点击,否则不会点击,AUC指标本质上不会关心score分数的绝对值大小,只会关心score的相对大小和排序情况。AUC的计算需要记得如下公式:

AUC=
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值