推荐系统-各环节要点汇总

love_data_scientist

已于 2022-07-28 17:40:37 修改

阅读量297

点赞数

分类专栏：推荐系统文章标签：机器学习人工智能数据挖掘

于 2021-04-27 17:27:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/love_data_scientist/article/details/116204642

版权

本文汇总了推荐系统的各个环节，从内容来源的审核与打标，到推荐方式的显式与隐式推荐，再到排序、重排序策略，以及冷启动问题和探索策略。涉及的模型包括FM、xgboost、W2V、CTR、DSSM等，还讨论了多目标学习、样本加权和冷启动解决方案。

摘要由CSDN通过智能技术生成

1.推荐物料来源

1.1 原始数据来源

根据平台属性不同，分为ugc,pgc,ogc

来源上：自己生产或者爬去

1.2 内容审核

把低质、敏感以及需要过滤的内容过滤，不进入可推荐内容库

1.3打标

给内容打标，比如keyword,实体词，tag等，方便文章显式分发

2.推荐方式

2.1显式推荐

2.1.1热点推荐

2.1.2根据keyword/实体词/tag推荐/类别

2.1.3根据用户画像推荐

2.1.4根据用户applist

2.2隐式推荐

2.2.1 FM/xgboost

2.2.2 w2v

2.2.3 graph2vec,

2.2.4user_cf, item_cf

2.2.5 swing

2.2.6 MF/svd/slim/FISM

2.2.7 RankSim

2.2.8 DSSM/DeepMatch

2.2.9序列推荐

2.2.10 基于gan推荐

2.2.11基于强化学习推荐

2.2.12 其他模型的U2U和I2I召回

3.排序（粗排或者精排）

粗排和精排的目标是一致的，区别在特征和模型结构，粗排相对少一些，关键看成本和目标的平衡

模型包括ctr,完播，时长，cvr等

信息流推荐中时长是决定用户阅读时间部分，直接影响广告收入，当然ctr、完播和留存等影响着长期收益，所以都要兼顾

多目标学习

3.1 样本加权

比如模型目标是ctr，把完播样本权重看作2

最低0.47元/天解锁文章

love_data_scientist

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐系统-各环节要点汇总

1.推荐物料来源1.1 原始数据来源根据平台属性不同，分为ugc,pgc,ogc来源上：自己生产或者爬去1.2 内容审核把低质、敏感以及需要过滤的内容过滤，不进入可推荐内容库1.3打标给内容打标，比如keyword,实体词，tag等，方便文章显式分发2.推荐方式2.1显式推荐2.1.1热点推荐2.1.2根据keyword/实体词/tag推荐/类别2.1.3根据用户画像推荐2.1.4根据用户applist2.2隐式推荐2.2.1 FM/xgbo.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。