推荐系统-向量召回

最新推荐文章于 2024-06-14 11:14:58 发布

得克特

最新推荐文章于 2024-06-14 11:14:58 发布

阅读量1k

点赞数 16

分类专栏：搜索推荐文章标签：推荐算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40548136/article/details/137229095

版权

搜索推荐专栏收录该内容

13 篇文章 1 订阅

订阅专栏

向量召回

采样

正样本采样-按热度降采样

$P_{pos}(t)=(\sqrt{\frac{z(t)}{a}}+1)* \frac{a}{z(t)}$
$z(t)=\frac{点击过t的用户数}{所有发生过点击行为的用户总数}$
$a$ 是一个超参，一般在1e-3~1e-5之间。

负样本采样-按热度过采样

FM：推荐算法中的瑞士军刀

loss

Point-NCE

Point-Sampled Sofxmax loss

Pair-hinge loss

Pair-BPRloss

List-RankNet

List-ListNet

理论

为什么说，用物料的后验消费数据做召回存在“幸存者偏差”？能将这些消费数据用于排序吗?

用来召回和排序的物料是那些已经被用户看到并产生了互动的物料。这种方法忽略了那些可能同样有吸引力但未被用户看到的物料。

使用物料的后验消费数据做召回，会放大“马太效应”，对新物料不友好，如何缓解？
使用物料的后验消费数据做召回确实可能会放大“马太效应”（Matthew Effect），即“富者愈富，穷者愈穷”的现象，在推荐系统中表现为热门物料越来越热门，而新物料或者冷门物料难以被发现。

冷启动策略：对于新加入系统的物料，采用特殊的冷启动策略，如基于内容的推荐（使用物料的属性信息做推荐），或者通过小范围的推广活动收集初步的用户反馈数据来提高其在推荐系统中的出现概率。
多样性增强：在推荐列表中有意识地增加物料的多样性，防止过度集中在少数热门物料上。这不仅可以为用户提供更丰富的选择，也能给新物料或冷门物料更多的曝光机会。
个性化推荐：利用用户的个性化信息进行推荐，而不是单纯依赖物料的全局热度。通过分析用户的历史行为、喜好特征等信息，为其推荐可能感兴趣的新物料或冷门物料。
带权重的后验消费数据：调整后验消费数据的权重，给予新物料或冷门物料更高的权重。这可以通过时间衰减函数、用户反馈显式评分或其他加权因子来实现，目的是调整物料在推荐系统中的排序权重，使新物料有更多被发现的机会。
使用先验知识：结合行业专家的知识或利用相似物料的数据来推荐新物料。比如，对于刚上线的影视作品，可以根据导演、演员、题材相似度等因素，推测其潜在的受众群体并给予推荐。

关注

16
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
推荐系统-向量召回

Ppostazt1∗ztazt所有发生过点击行为的用户总数点击过t的用户数a是一个超参，一般在1e-3~1e-5之间。
复制链接

扫一扫

专栏目录

得克特 CSDN认证博客专家 CSDN认证企业博客

码龄7年

264: 原创

3万+: 周排名

5439: 总排名

48万+: 访问

: 等级

5866: 积分

251: 粉丝

473: 获赞

80: 评论

1664: 收藏

私信

关注

热门文章

分类专栏

搜索推荐 13篇
Tensorflow 12篇
大数据 32篇
Java 5篇
Pytorch 9篇
数学之美 21篇
爬虫 1篇
Keras 9篇
python 33篇
基础 5篇
深度学习 34篇
机器学习 16篇
机器视觉 6篇
论文 8篇
算法 31篇
C++ 26篇
K8S&&Docker 7篇
Linux 8篇
Web 4篇
NLP 13篇

最新评论

Deconfounding Duration Bias in Watch-time Prediction for Video Recommendation
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
算法：归并排序
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数。
算法：位运算
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
算法: 字典序(二进制排序)
CSDN-Ada助手: 二维数组是什么？怎么用？
算法: 字典序(二进制排序)
CSDN-Ada助手: 二维数组是什么？怎么用？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。