协同过滤召回算法的几个优化点（一）

最新推荐文章于 2024-01-02 01:20:32 发布

算法路上的快乐小仙

最新推荐文章于 2024-01-02 01:20:32 发布

阅读量1.2k

点赞数 3

分类专栏：推荐召回算法文章标签：算法协同过滤推荐系统机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26053593/article/details/105185633

版权

协同过滤召回算法的几个优化点（一）

协同过滤算法是电商推荐场景中非常常见、发展历史也比较久的一类启发式算法。
通常情况下，电商的用户数量远比商品数量大、稳定性上来说也是商品相对稳定。
所以电商场景下通常使用Item Based CF算法，同时，采用余弦相似度的较多。

以此为例，记录一下项目中实际用到的几个优化点，可视情况组合使用。

原始评分预测公式¹： $\widehat{r}_{ui}={\textstyle\sum_{j\in S(j,k)\cap N(u)}}w_{ij}r_{uj}$

其中：

$\widehat{r}_{ui}$ ：用户u对物品i的预测评分
N(u)：用户喜欢的（有过评价的）物品集合
S(j,k)：和物品j最相似的K个物品集合
$S(j,k)\cap N(u)$ ：和物品j最相似的K个物品中，用户评价过的物品集合
$w_{ij}$ ：物品i和j的相似度
$r_{uj}$ ：用户u对物品j的兴趣（评分）

物品相似度 $w_{ij}=\frac{\left|N(i)\cap N(j)\right|}{\left|N(i)\right|}$
其中N(i)是喜欢物品i的用户数，分子是同时喜欢物品i和j的用户数。

优化点1：热门物品惩罚

如果物品j过于热门，有很多用户进行了评分，那么它会参与到许多物品的相似度计算中，而且所计算出的 $w_{ij}$ 会很大，造成任何一个物品都和热门物品j有很大的相似度，这对于推荐的个性化和多样性是不利的。

一个改进的方法是将 $w_{ij}$ 的分母由 $\left|N(i)\right|$ 改为 $\sqrt{\left|N(i)\right|\cdot\left|N(j)\right|}$ ，从而降低物品j的权重。

优化点2：显式使用评分值

原始的相似度计算公式中，分子 $\mid N(i)\cap N(j)\mid$ 是同时喜欢物品i和j的用户数、分母 $\mid N(i)\mid$ 是喜欢物品i的用户数，都没有用到评分值࿱

最低0.47元/天解锁文章

算法路上的快乐小仙

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
协同过滤召回算法的几个优化点（一）

记录了电商场景下通常使用的Item Based CF算法的几个优化点：热门物品惩罚，显式使用评分值，相似度的显著性加权，评分变形，活跃用户惩罚，基于物品和基于用户协同过滤方法的融合，topk相似物品的加速计算
复制链接

扫一扫

专栏目录

算法路上的快乐小仙 CSDN认证博客专家 CSDN认证企业博客

码龄9年

1: 原创

138万+: 周排名

140万+: 总排名

1217: 访问

: 等级

27: 积分

1: 粉丝

3: 获赞

1: 评论

8: 收藏

私信

关注

热门文章

协同过滤召回算法的几个优化点（一） 1217

分类专栏

最新评论

协同过滤召回算法的几个优化点（一）
Sukie_csdn: 优化1、热门物品惩罚优化2、显式使用评分值优化3、相似度的显著性加权优化4、评分变形优化5、活跃用户惩罚优化6、ICF和UCF的结合 https://www.cnblogs.com/pinard/p/6349233.html

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。