[推荐系统02]基于近邻的推荐

最新推荐文章于 2022-09-07 23:32:14 发布

小帆-Matter

最新推荐文章于 2022-09-07 23:32:14 发布

阅读量1.2k

点赞数

分类专栏： rec

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/matter605924657/article/details/53084138

版权

本文详细介绍了基于近邻的推荐方法，包括协同过滤、基于用户和物品的推荐策略，以及评分标准化、相似度计算和近邻选择的关键点。讨论了不同推荐策略的准确性和效率，强调了相似度计算在推荐系统中的重要性。

摘要由CSDN通过智能技术生成

基于近邻的推荐方法

基于近邻的推荐方法
推荐策略
近邻推荐方法的关键点

推进系统要找到的是最优项（Best Item）和最优N项（Top-N）

基本概念

符号定义说明

用户集U(user)，物品集I(item)，评价分数集合S(score)

$r_ui$ 是用户u对i的评分

$I_u$ 是用户u评分过的物品集合

$U_i$ 是对i打过分的用户集合

$I_uv$ 同时被用户u和v打过分的物品集合

$U_ij$ 同时对物品i和j打过分的用户集合

常用准确率评判指标

平均绝对误差（MAE）

$M A E (f) = 1 | R t e s t | \sum r u i \in R t e s t | f (u, i) - t u i |$ $MAE(f)=\frac{1}{|R_{test}|}\sum_{r_{ui} \in R_{test}}|f(u,i)-t_{ui}|$
均方根误差(RMSE)
$R M S E (f) = 1 | R t e s t | \sum r u i \in R t e s t (f (u, i) - t u i) 2 ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ \sqrt$ $RMSE(f)=\sqrt{\frac{1}{|R_{test}|}\sum_{r_{ui} \in R_{test}}(f(u,i)-t_{ui})^2}$
对于2元的评分用准确率召回率

协同过滤概述

如果用户u和用户v在其他物品上的评分很相似，呢么用户u对新物品i的评分和用户v对物品i的评分也是相似的
若其他用户v对物品i和j的评分相似，则用户u对对物品i和j的评分相似

基于近邻的推荐有2种方法，基于用户和基于物品

基于用户
- 评估用户u对物品i的偏好程度，利用已经对i评价过，而且和用户u有相似评级习惯的用户，把这些用户作为近邻来预测用户u对物品i的偏好
基于物品
- 基于用户u对给与物品i相似的物品的评分，来预测用户对i的评分，相似物品指的是被一些用户评价相似的物品

基于近邻的方法直接应用评分数据进行预测，基于模型的推荐利用评分来学习预测模型

基于模型的方法常用模型

贝叶斯聚类（Bayesian Clustering）
潜在语义分析（Latent Semantic Analysis）
潜在狄利克雷分布（Latent Dirichlet Allocation）
最大熵（Maximum Entropy）
玻尔兹曼机（Boltzmann Machines）
支持向量机（Support Vector Machine）
奇异值分解（Singular Value Decomposition）

基于邻近方法的优势

简单：可调参数只有一个，最近邻居数
合理性：近邻用户或相似物品给推荐结果直观的解释
高效性：相比基于模型的推荐不需要训练，但是推荐阶段消耗大于基于模型的推荐，可以离线预计算近邻提高效率
稳定性：用户，物品，评分增加的时候，对推荐结果影响较小。增加物品的评分只需要重新计算相关的评分即可，不用全局重新计算

推荐策略

基于用户评分

预测评分 $\hat{r}_{ui}$ 可以利用用户u的k近邻，即与用户u相似度w最高的k个用户且这些用户对物品i有打分 $N_i(u)$ 计算

r ̂ u i = 1 | N i u | \sum v \in N i (u) r v i

$\hat{r}_{ui}=\frac{1}{|N_i{u}|}\sum_{v\in N_{i}(u)}r_{vi}$

这个计算方法存在问题：每个用户评价相似程度不同，就是说和用户u更像的用户，他的评分代表性更强，所以需要加入相似程度作为权重，并进行权重标准化

r ̂ </

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[推荐系统02]基于近邻的推荐

基于近邻的推荐方法
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。