- 召回曝光高但是点击率不高是为什么?
数据层面:模型训练时数据有偏差,训练数据的正样本大量集中在热销商品
特征层面:用户侧特征区分度不明显导致模型未能关注到用户个性化差异
模型层面:未捕获到用户个性化偏好
其他层面:item也许确实属于用户想点击的,但是一些外部原因导致user没有发生点击(商品价格过高,视频时长过长等等);u2i召回算法力度不够 - 新增一路召回后,大盘整体的点击率没有变化,但是单看新召回的点击非常低,为什么?
较差质量的召回未能影响整体数据 => 这一路召回体量太小或者被后续的排序模型所歧视 - 一些常见的召回算法(没什么依据,我自己整理的)
tag2item:标签召回,流行度(榜单)召回
item2item:协同过滤,关联规则,矩阵分解
user2item:用户画像召回,DSSM
embedding:YoutubeDNN,GE(graph embedding)框架(如DeepWalk,Node2vec,LINE,SDNE)
客制化召回:(商品)节日召回,(视频、UGC)热搜推荐 - 尝试过的、稳健的排序模型
LR:简单易实现的线性模型,建模意图明确
FM:加入了自动二阶特征交叉的LR,二阶特征权重为隐向量乘积
Wide&deep:泛化性与记忆性的结合,计算复杂度的优化
DIN:加入了attention(query为待排序的广告商品,key和value都是用户序列中的商品)的CTR预估模型,两个创新点(Dice激活函数与仅更新batch内参与计算的参数) - 未来可能创新的领域(没什么依据,我自己整理的)
深度模型的算子自动化组合(AutoML),强化学习与在线更新,多臂老虎机与算法层面的个性化,探索与利用
推荐系统中一些问题的思考
最新推荐文章于 2024-08-20 17:50:28 发布