推荐系统（基本方法+评估指标+工具）

最新推荐文章于 2024-07-28 17:21:23 发布

骚铭科技

最新推荐文章于 2024-07-28 17:21:23 发布

阅读量9.3k

点赞数 2

分类专栏：机器学习推荐系统文章标签：推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_21645561/article/details/62425760

版权

本文介绍了推荐系统的三种基本方法：基于邻居的方法、矩阵分解和针对隐式反馈的矩阵分解。针对评估指标，讲解了误差、百分位排名和Hit Ratio @ N。最后提到了用于优化的SGD和ALS工具，以及推荐系统工具的资源链接。

摘要由CSDN通过智能技术生成

基本方法
评估指标
工具
参考资料

基本方法

1 Neighborhood-based (item-item)

参考文献：Item-based Collaborative Filtering Recommendation Algorithms

根据与item $i$ 相似的 $k$ 个 items，估计出对item $i$ 的评分。采用加权平均的方法，如下，

$s_{ij}$ 为 item $i$ 与 item $j$ 的相似度， $r_{ui}$ 为 user $u$ 对 item $i$ 的评分。

r ̂ u i = \sum j \in S k ( i ; u ) s i j r u j \sum j \in S k ( i ; u ) s i j

$\hat{r}_{ui} = \frac {\sum_{j \in S^k(i;u)} s_{ij} r_{uj}} {\sum_{j \in S^k(i;u)} s_{ij}}$
相似度的计算有多种方式，例如余弦相似度，皮尔森相关系数等。

cosine

corelation

当然，还可以用 user-user 估计，但是users 数目往往很大，不适合较大规模数据。

2 Model-based （矩阵分解）

参考文献：Matrix Factorization Techniques for Recommender Systems

基于相似度的方法只能找出相似的items，意味着向一个看了动作片的人推荐更多动作片。但现实情况是，喜欢看动作片的人可能不仅仅喜欢动作片，也喜欢爱情片，或者爱情动作片。这就需要挖掘出潜在因素来进行推荐（latent factors）。

将 user-item 评分矩阵分解为 user_features x item_features。

这里写图片描述

由于R矩阵是非常稀疏的，有大量缺失值，如果使用传统SVD分解需要填补缺失值。这样做有两个缺点：1. 填补什么值？会造成不准确；2. 填补后变成稠密矩阵，计算量大增。于是采用忽略缺失值的方法，最小化 least square。但要注意防止 overfitting，加入正则化项（与模型复杂度成正比）。<

最低0.47元/天解锁文章

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。