推荐系统中一些问题的思考

  1. 召回曝光高但是点击率不高是为什么?
    数据层面:模型训练时数据有偏差,训练数据的正样本大量集中在热销商品
    特征层面:用户侧特征区分度不明显导致模型未能关注到用户个性化差异
    模型层面:未捕获到用户个性化偏好
    其他层面:item也许确实属于用户想点击的,但是一些外部原因导致user没有发生点击(商品价格过高,视频时长过长等等);u2i召回算法力度不够
  2. 新增一路召回后,大盘整体的点击率没有变化,但是单看新召回的点击非常低,为什么?
    较差质量的召回未能影响整体数据 => 这一路召回体量太小或者被后续的排序模型所歧视
  3. 一些常见的召回算法(没什么依据,我自己整理的)
    tag2item:标签召回,流行度(榜单)召回
    item2item:协同过滤,关联规则,矩阵分解
    user2item:用户画像召回,DSSM
    embedding:YoutubeDNN,GE(graph embedding)框架(如DeepWalk,Node2vec,LINE,SDNE)
    客制化召回:(商品)节日召回,(视频、UGC)热搜推荐
  4. 尝试过的、稳健的排序模型
    LR:简单易实现的线性模型,建模意图明确
    FM:加入了自动二阶特征交叉的LR,二阶特征权重为隐向量乘积
    Wide&deep:泛化性与记忆性的结合,计算复杂度的优化
    DIN:加入了attention(query为待排序的广告商品,key和value都是用户序列中的商品)的CTR预估模型,两个创新点(Dice激活函数与仅更新batch内参与计算的参数)
  5. 未来可能创新的领域(没什么依据,我自己整理的)
    深度模型的算子自动化组合(AutoML),强化学习与在线更新,多臂老虎机与算法层面的个性化,探索与利用
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值