【推荐算法学习笔记一】Memory-Based Collaborative Filtering

最新推荐文章于 2024-08-10 07:01:04 发布

Aha_tiger

最新推荐文章于 2024-08-10 07:01:04 发布

阅读量2.5k

点赞数

分类专栏：推荐算法

推荐算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

基于显示反馈（explicit feedback）的推荐

问题描述

假设我们将用户的显示反馈记录在一个矩阵（评分矩阵）中：

矩阵中的数字代表用户对物品的评分，？表示缺失值。这是一个预测评分的问题，我们需要通过群体智慧来预测？中的值

集体智慧假设

User-based CF:

在过去有相同品味的用户们在未来也很有可能具有相似的品味。

Item-based CF:

一个用户很有可能喜欢与他过去喜欢的物品相似的物品

符号定义

相似度

皮尔森相关系数----Pearson correlation coefficient (PCC)

user_u和user_w之间的相似度：

调整后的余弦相似度----Adjusted Cosine similarity

item_k和item_j 之间的相似度：

两种相似度的取值范围都是[-1,1]。-1为负相关，1为正相关。

邻居选择过程

User-based CF

最近的Top-K 邻居：

Item-based CF

最近的Top-K 邻居：

可能存在的问题

对于user和item来说，可能邻居不够K个（以user_u为例，就是买过自己买过的物品的其他user数量不足K个），这时候将会用到整个邻居集，这种情况下，靠邻居的信息来计算并没有那么可靠。

预测评分公式 (Prediction Rule)

User-based CF

user_u对item_ j的预测评分为：

Item-based CF

user_u对item_ j的预测评分为：

在预测公式中，所有的数值都是预计算好的，没有需要学习的参数。

其他的一些细节想到再补充。

本文内容来自SZU 潘老师的课件。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Aha_tiger

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

一个memory-based协同过滤算法的改进（基于隐式评分）

Welcome to my black parade

12-25

2607

先来看定义。“显示评分”俗称打分，如Netflix中允许用户给每部电影打1-5分，豆瓣电影也允许用户给电影评星级（很差—力荐）。而“隐式评分”是指用户的浏览记录，购买记录等等，用binary数值0表示没有浏览/购买，1表示浏览/购买过；或者是标示次数的信息：浏览/购买过几次。可以看到，隐式评分不能反映用户对一个物品的喜好。如果评分r_ij为0，不能代表用户i不喜欢物品j，可能只是因为用

qq_35771020的博客

12-22

1423

一、基本信息论文题目：《A Survey of Collaborative Filtering Techniques》发表时间：February 2009 论文作者及单位：Xiaoyuan Su(Florida Atantic University)、Taghi M.Khoshgoftaar(Florida Atantic University) 论文地址：https://www.as...

参与评论您还未登录，请先登录后发表或查看评论

Memory-based-collaborative-filtering:高效的协同过滤算法实现-推荐系统

03-11

基于内存的协作过滤包含基于用户的CF（），基于项目的CF（）健壮的k近邻推荐系统在Python中使用MovieLens数据集基于用户的协作过滤器 K = 25运行时间：1s RMSE：0.940611 MAE：0.884748。基于内存的算法易于实现，并且可以产生合理的预测质量。基于内存的CF的缺点在于，它无法适应实际情况，也无法解决众所周知的冷启动问题，即当新用户或新项目进入系统时。

memory-based 协同过滤（CF）方法

weixin_34077371的博客

02-12

599

协同过滤（collaborative filtering，CF）算法主要分为memory-based CF 和 model-based CF，而memory-based CF 包括user-based CF和item-based CF。基于用户的(User-based)协同过滤算法基于用户的(User-based)协同过滤算法是根据邻居用户的偏好信息产生对目标用户的推荐。它基于这样...

神经协同过滤（Neural Collaborative Filtering）项目教程

最新发布

gitblog_00089的博客

08-10

305

神经协同过滤（Neural Collaborative Filtering）项目教程 neural_collaborative_filteringNeural Collaborative Filtering项目地址:https://gitcode.com/gh_mirrors/ne/neural_collaborative_filtering 项目介绍神经协同过滤（Neural Collabo...

5.基于记忆的推荐算法（memory-based model）

tanyanzimo的博客

07-31

1348

http://m.blog.csdn.net/blog/kevin7658/23744641

I‘m Frank Lee

06-17

582

Badrul Sarwar, George Karypis, Joseph Konstan, and John Riedl 摘要推荐系统将知识发现技术应用于在生活中针对信息、产品或服务提出个性化建议的问题。这些系统，尤其是基于k近邻协同过滤的系统，正在网络上获得广泛的成功。可用信息的巨大增长，以及最近访问Web站点的访客的数量，对推荐系统提出了一些挑战。它们是：产生高质量的推荐，每秒为数百万个用户和项目提供高质量推荐，并在数据稀疏的情况下实现更高的质量。在传统的协作过滤系统中，工作量随着系统中参与人数的增

recommender-systems-in-python:网上有关与Python推荐系统相关的文章和材料的Jupyter笔记本集合

05-11

数据挖掘：理论与算法学习笔记

m0_52899614的博客

12-28

1954

后剪枝则是先从训练集中生成一棵完整的决策树，然后自底向上的考察每一个非叶结点，和预剪枝相反，如果将该结点对应的子树替换为叶结点能给决策树带来性能上的提升，则将该子树替换为叶结点。原理：根据特征的先验概率（训练样本分析得到的概率），利用贝叶斯公式计算出其后验概率（要分类对象特征的条件概率），选择概率值最大的类作为该特征所属的类。信息增益越大越好，即该属性的效能越高，越有区分度。Elman Network：此算法有一定的记忆性，通过之前的输入推出答案，输出不仅仅取决于当前的输入，还取决于之前的输入。

论文笔记：Empirical Analysis of Predictive Algorithms for Collaborative Filtering

qq_35771020的博客

02-25

1511

一、基本信息论文题目：《Empirical Analysis of Predictive Algorithms for Collaborative Filtering》发表时间：UAI 1998 论文作者及单位：论文地址：https://dl.acm.org/citation.cfm?id=2074100 二、摘要协同过滤使用有关用户偏好的数据库来预...

论文笔记|ITEM2VEC: NEURAL ITEM EMBEDDING FOR COLLABORATIVE FILTERING

年迈的艺术家们

12-20

1701

前两天在朋友圈看到学弟发的一个图，巨佬学习是hash，大佬学习是遍历，我学习是无穷递归，今天才发现诚不我欺。早上决定将YouTube 16年在RecSys那篇经典的文章学习一下，结果看到Negative Sample就看不懂了，然后在知乎查了一下，又在大佬的指引下找ICML 2016的这篇文章学习一下。推荐系统最经典的算法是基于用户相似度的推荐算法u2u，称为memory-based，和基于物品...

Memory-based和Model-based推荐系统

很吵请安静

06-15

1394

以下理解参考该文章: memory-based-vs-model-based-recommendation-systems Memory-based: 主要通过计算近似度来进行推荐，比如user-based和item-based协同过滤，这个两个模式中都会首先构建用户交互矩阵，然后矩阵的行向量或者列向量可以用来表示用户和item，然后计算用户或者物品的相似度来进行推荐。这里叫Memory是可能是因为要事先把交互矩阵载入到内存中进行计算吧。 Model-based:主要是对交互矩阵进行填充，预测用户购买某个

Collaborative filtering 协同过滤

yangfan1007的博客

05-10

385

Collaborative filtering，即协同过滤，是一种新颖的技术。协同过滤分成了两个流派，一个是Memory-Based，一个是Model-Based。关于Memory-Based的算法，就是利用用户在系统中的操作记录来生成相关的推荐结果的一种方法主要也分成两种方法，一种是User-Based，即是利用用户与用户之间的相似性，生成最近的邻居，当需要推荐的时候，从最近的邻居

不想做数分的码农不是好运营

10-22

544

统之协同过滤Collaborative Filtering1. 基本思想与算法核心2. 算法种类3. 相似度的相关计算方法3.1 杰卡德(Jaccard)相似系数3.2 欧式距离3.3 余弦距离（余弦相似度）3.4 皮尔逊相似度 1. 基本思想与算法核心协同过滤推荐算法是诞生最早，并且较为著名的推荐算法。算法主要功能是：预测和推荐。预测过程是预测用户对没有购买过的物品的可能打分值，推荐是根据预测阶段的结果推荐用户最可能喜欢的一个或Top-N个物品。基本思想：是根据用户之前的喜好以及其他兴趣相近的用户的

基于记忆(Memory-Based)与基于模型(Model-Based)的辨析

每一点星光，都是一个来自其他世界的问候

03-01

5285

转载自：https://yasserebrahim.wordpress.com/2012/10/13/memory-based-vs-model-based-recommendation-systems/ 对这两个定义有一个比较客观的分析。 Memory-Based vs. Model-Based Recommendation Systems Anywhere

weixin_42592415的博客

12-17

1445

moonfansLTH的博客

08-26

1490

Paper综述 item-based CF 基础论文题目：item-based collaborative filtering recommendation algorithms Introduction 传统user-based CF面临两个基础的问题挑战1：提升cf算法的scalability（real-time）实时搜索巨大数量的potential neighb...

糖葫芦君的博客

01-03

5749

X = set of 顾客 S = set of 商品 Utility function: X ×\times× S = R R = 打分的集合本文将主要针对以下关键问题进行阐述：（1）收集矩阵中已知的打分：怎么收集utility matrix中的数据（2）根据已知的打分推断未知的得分：我们主要关心的是未知的高分项，因为我们只想知道客户喜欢什么而不关心客户不喜欢什么（3）评估推断方...

今天你学习了吗

11-06

3030

目录 0. 前言 1. 相似度 1.1. 欧式距离（Euclidean metric） 1.2. 皮尔逊相关系数（Pearson correlation coefficient） 1.3. 余弦相似度（Cosine similarity） 2. 基于内容（物品）的推荐算法 3. 基于用户的推荐算法 4. 基于内容（物品）的协同过滤推荐算法 5. 基于用户的协同过滤推荐算法 6....

User-based Collaborative Filtering算法原理

05-13

User-based Collaborative Filtering是一种基于用户的协同过滤推荐算法，其原理可以简单概括为： 1. 找到和目标用户兴趣相似的其他用户。 2. 利用这些相似用户的历史行为数据（如评分、购买记录等）来预测目标用户...