PUGC作者维度的推荐策略

最新推荐文章于 2024-07-21 22:27:18 发布

码一码码码

最新推荐文章于 2024-07-21 22:27:18 发布

阅读量194

点赞数 1

文章标签： python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39586997/article/details/120591848

版权

目录

一、作者倒排

二、优质pugc作者筛选

三、作者维度的兴趣探索

四、作者分层

概念定义：

1、PGC(Professionally-generated Content)又叫PCC,是指专业生产内容。由专业人士对内容

的个性化.PGC是对内容进行划分的概念，指更加专业化的内容、优质化的内容，内容比较专

业。

2、UGC(User-generated Content)指用户生产内容。就是用户自行生产内容，由网民、普通用

户主动创造并上传的内容，是以粉丝为中心，以用户的互动方式为内容的。UGC是鼓励每一

位普通访客参与互动起来，才能打开思维方式，为目标站点不断地输出内容。

一、作者倒排

1、对用户关注的作者，召回作者最新上传的视频；

2、根据用户观看历史中出现的作者，召回这些作者的头部视频，送到CTR排序后取头部视频，作为召回结果；

二、优质pugc作者筛选

1、根据后验信息（如点击率、观影时长等消费数据）计算出作者的得分，从中筛选出优质pugc作者，在协同过滤、embedding模型等中辅助训练，如作为物品特征 / 用户特征参与模型训练，或者在协同过滤计算相似度时作为权重，或者在大量召回结果中作为阈值、对优质pugc作者置顶；

2、根据先验信息（通常是运营配置的一批特殊pugc），单独出一路召回，不送排序，直接强插；

三、作者维度的兴趣探索

1、通过计算作者维度的共现矩阵或embedding相似度，找到用户可能会感兴趣的相似作者，召回其头部视频；

四、作者分层

1、根据粉丝数、更新频率、内容垂直度、原创度、创作形式、账号类型，统一提炼作者评分综合指标，根据综合指标分数，为作者打分并分层

2、在爬虫时，对头部作者高频爬取，低质作者低频爬取，以保证现有资源的情况下提升爬虫端的数据源质量

3、分层有利于筛选优质PGC作者，在做兴趣探索时，也可以进行分层的作者探索，或低质向优质作者的单向探索

码一码码码

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
PUGC作者维度的推荐策略

目前作者维度的推荐策略主要有：一、作者倒排二、优质pugc作者筛选，加入协同过滤的评分中三、作为物品特征/用户特征，用于模型训练四、作者维度的兴趣探索
复制链接

扫一扫

码一码码码 CSDN认证博客专家 CSDN认证企业博客

码龄7年

50: 原创

39万+: 周排名

61万+: 总排名

4万+: 访问

: 等级

595: 积分

30: 粉丝

76: 获赞

16: 评论

246: 收藏

私信

关注

热门文章

最新评论

youtubeDNN及其优化
DataToBetter: 请问博主，（13）中提到的用于User CF效果如何，我目前训练出来的User embedding之间都高度相似，难以区分相似用户和不相似用户
数据预处理方法综述
m0_60703185: 有价值。
负采样方式
m0_60703185: 够专业！
word2vec及其优化
Mr.姚先森: 兄弟，代码有吗
负采样方式
m0_60703185: 很经典，点赞。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。