目前工业界常用的推荐系统模型有哪些?

目前工业界常用的推荐系统模型有哪些? - 知乎前言众所周知,推荐可分为以下四个流程,分别是召回、粗排、精排以及重排。其中,召回是源头,在某种意义…https://www.zhihu.com/question/314773668/answer/2479450276

 目前工业界常用的推荐系统模型有哪些? - 知乎DIN(Deep Interest Network)模型是阿里妈妈团队在2018年发表的文章,基于阿里广告业务场景(电商业…https://www.zhihu.com/question/314773668/answer/2422958180

  • 召回策略:
  1. 统计类,热度,LBS;
  2. 协同过滤类,UserCF、ItemCF;
  3. U2T2I,如基于user tag召回;
  4. I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);
  5. U2I类,如DSSM、YouTube DNN、Sentence Bert;
  • 排序策略,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;
  1. 常见的特征挖掘(user、item、context,以及相互交叉);
  2. CTR预估,如LR、GBDT、FM、FFM、DNN、Wide&Deep、DCN、DeepFM、DIN、DFN;
  • 探索与发现(bandit、Q-Learning、DQN);
  • 推荐理由:
  1. 统计式,如:全城热搜、区域热搜;
  2. 行为,如:看过、买过、看了又看、搜了又搜;
  3. 推荐语生成(抽取式,生成式);

作者:tracholar

  • 召回层:召回解决的是从海量候选item中召回千级别的item问题
  1. 策略规则类:热度召回、LBS、历史行为重定向(买了又买、点了没买)、基于标签召回、业务特有的其他规则
  • 模型类:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回
  • 粗排层:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排
  • 精排层:精排解决的是从千级别item到几十这个级别的问题
  1. 预估:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN
  2. 多目标:MOE,MMOE,MTL(多任务学习)
  3. 打分公式融合: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化等
  • 重排层:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)
  • 展示层:
  1. 推荐理由:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等
  2. 首图优选:CNN抽特征,汤普森采样
  • 探索与利用:随机策略(简单有效),汤普森采样,bandit,强化等
  • 产品层:交互式推荐、分tab、多种类型物料融合
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值