推荐-线下AUC提升,线上CTR无提升

线下AUC提升,线上AB测试无提升

1. 判断线上线下特征提取是否一致?

2. 数据是否泄露,简言之,倒因为果,某特征跟目标有很高相关性?

3. 是否需要一味地添加特征?

4. 线上线下样本空间分布是否一致?比如:推荐系统中,训练数据集合,仅包含有点击行为的用户,过滤了无点击行为的用户,这样的过滤是否合理,是否通过随机负采样保留仅负样本用户数据,通过AB测试检验

5. 训练数据中,高活跃user bias 是否去除,比如高活跃用户每天产生100个点击行为,而低活跃度用户,每天仅1-2个点击行为,这样,这样为处理的数据,训练出来的模型受高活跃用户影响较大,实际需要,降采样高活跃用户行为数据样本,使不同活跃用户样本基本一致 -- Youtube早期论文做法

6. 理解业务,负样本一定是负样本么?举例:某电影推荐场景,每次推荐6部电影,用户可能点击其中某一部,而,因为时间等因素,用户看完一部之后,不再看其它电影,而其他电影一定是负样本么? 这时,负样本应该怎么处理呢?这个值得考虑

未完待续。。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值