【推荐系统】召回与排序区别

之前对召回和排序训练数据的产生有很多疑惑,现在来归纳总结~

召回主要是负样本;排序主要是特征。

首先需要了解候选池有多大?候选池小根本不用做召回,可以直接排序。

如果用户根本没有点击过任何的item,那么这个用户需要去除吗?直接去除(只有负样本,没有正样本)

召回

  • als矩阵分解类算法(一天一次,没有实时行为)
  • fpg itemcf类 
  • itemcf比矩阵分解效果好一些
  • u2i算作一路召回(youtubeDNN),一般来说i2i(item2vec)的效果更好;DSSM就是u2i召回,感觉用的更多。

排序

  • lightgbm 对分类特征好一点;
  • xgb 连续特征好一点,cnt次数这种ui交互类特征。
  • xgb+lr:流量大的场景用这种

排序算法很重要的特征:除了用户行为类,还有ui交互这种统计类特征。比如说,用户点了某个品类多少次?点了很多的鞋子,说明对鞋子很感兴趣。

统计类交互特征 如何理解?如上

参考:

工业界推荐系统中有哪些召回策略? - 石塔西的回答 - 知乎

负样本为王:评Facebook的向量化召回算法 - 石塔西的文章 - 知乎

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值