推荐系统中一些问题的思考

最新推荐文章于 2024-08-20 17:50:28 发布

浪得虚名9527

最新推荐文章于 2024-08-20 17:50:28 发布

阅读量183

点赞数

文章标签：推荐系统算法

本文链接：https://blog.csdn.net/fashi11211/article/details/118379867

版权

                    
                        
                    
                    召回曝光高但是点击率不高是为什么？
 数据层面：模型训练时数据有偏差，训练数据的正样本大量集中在热销商品
 特征层面：用户侧特征区分度不明显导致模型未能关注到用户个性化差异
 模型层面：未捕获到用户个性化偏好
 其他层面：item也许确实属于用户想点击的，但是一些外部原因导致user没有发生点击（商品价格过高，视频时长过长等等）；u2i召回算法力度不够
新增一路召回后，大盘整体的点击率没有变化，但是单看新召回的点击非常低，为什么？
 较差质量的召回未能影响整体数据 => 这一路召回体量太小或者被后续的排序模型所歧视
一些常见的召回算法（没什么依据，我自己整理的）
 tag2item：标签召回，流行度（榜单）召回
 item2item：协同过滤，关联规则，矩阵分解
 user2item：用户画像召回，DSSM
 embedding：YoutubeDNN，GE（graph embedding）框架（如DeepWalk，Node2vec，LINE，SDNE）
 客制化召回：（商品）节日召回，（视频、UGC）热搜推荐
尝试过的、稳健的排序模型
 LR：简单易实现的线性模型，建模意图明确
 FM：加入了自动二阶特征交叉的LR，二阶特征权重为隐向量乘积
 Wide&deep：泛化性与记忆性的结合，计算复杂度的优化
 DIN：加入了attention（query为待排序的广告商品，key和value都是用户序列中的商品）的CTR预估模型，两个创新点（Dice激活函数与仅更新batch内参与计算的参数）
未来可能创新的领域（没什么依据，我自己整理的）
 深度模型的算子自动化组合（AutoML），强化学习与在线更新，多臂老虎机与算法层面的个性化，探索与利用

                

浪得虚名9527

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐系统中一些问题的思考

召回曝光高但是点击率不高是为什么？数据层面：模型训练时数据有偏差，训练数据的正样本大量集中在热销商品特征层面：用户侧特征区分度不明显导致模型未能关注到用户个性化差异模型层面：未捕获到用户个性化偏好其他层面：item也许确实属于用户想点击的，但是一些外部原因导致user没有发生点击（商品价格过高，视频时长过长等等）；u2i召回算法力度不够新增一路召回后，大盘整体的点击率没有变化，但是单看新召回的点击非常低，为什么？较差质量的召回未能影响整体数据 => 这一路召回体量太小或者被后续的排序模型.
复制链接

扫一扫