协同过滤系统基于用户的评分预测

推荐算法–协同过滤

什么是协同过滤

协同过滤推荐(Collaborative Filtering recommendation)是在信息过滤和信息系 统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行 推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用 户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜 好程度预测。 协同过滤是迄今为止最成功的推荐系统技术,被应用在很多成功的推荐系统中。 电子商务推荐系统可根据其他用户的评论信息,采用协同过滤技术给目标用户推 荐商品。 协同过滤算法主要分为基于启发式和基于模型式两种。 其中,基于启发式的协同过滤算法,又可以分为基于用户的协同过滤算法 (User-Based)和基于项目的协同过滤算法(Item-Based)。  启发式协同过滤算法主要包含 3 个步骤: 1)收集用户偏好信息; 2)寻找相似的商品或者用户; 3)产生推荐。 “巧妇难为无米之炊”,协同过滤的输入数据集主要是用户评论数据集或者行为数 据集。这些数据集主要又分为显性数据和隐性数据两种类型。其中,显性数据主 要是用户打分数据,譬如用户对商品的打分,五分制的 1 分,2 分等。 但是,显性数据存在一定的问题,譬如用户很少参与评论,从而造成显性打分数 据较为稀疏;用户可能存在欺诈嫌疑或者仅给定了部分信息;用户一旦评分,就 不会去更新用户评分分值等。 而隐性数据主要是指用户点击行为、购买行为和搜索行为等,这些数据隐性地揭 示了用户对商品的喜好。 隐性数据也存在一定的问题,譬如如何识别用户是为自己购买商品,还是作为礼 物赠送给朋友等。

基于用户的协同过滤

1、方法:
1.收集用户信息 收集可以代表用户兴趣的信息。一般的网站系统使用评分的方式或是给予评价, 这种方式被称为“主动评分”。另外一种是“被动评分”,是根据用户的行为模式由 系统代替用户完成评价,不需要用户直接打分或输入评价数据。电子商务网站在 被动评分的数据获取上有其优势,用户购买的商品记录是相当有用的数据。 2.最近邻搜索(Nearest neighbor search, NNS) 以用户为基础(User-based)的协同过滤的出发点是与用户兴趣爱好相同的另一 组用户,就是计算两个用户的相似度。例如:查找 n 个和 A 有相似兴趣用户,把 他们对 M 的评分作为 A 对 M 的评分预测。一般会根据数据的不同选择不同的算 法,目前较多使用的相似度算法有 Pearson Correlation Coefficient(皮尔逊相关系 数)、Cosine-based Similarity(余弦相似度)、Adjusted Cosine Similarity(调整后 的余弦相似度)。 基于用户(User-Based)的协同过滤算法首先要根据用户历史行为信息,寻找与 新用户相似的其他用户;同时,根据这些相似用户对其他项的评价信息预测当前 新用户可能喜欢的项。 给定用户评分数据矩阵 R,基于用户的协同过滤算法需要定义相似度函数 s: U×U→R,以计算用户之间的相似度,然后根据评分数据和相似矩阵计算推荐结 果。

如何计算

1、基于用户的协同过滤推荐系统在搜集了用户的信息之后有些用户对商品的评分不全面我们就需要通过算法对该用户该商品的评分进行预测
2、在预测是我们就需要找到用户的相邻用户,通过他们对商品的评分来预测出该用户对该商品的评分,此时我们就需要用到相似度,我们常用的相识度算法有以下两种:
1、皮尔逊相关系数:
在这里插入图片描述
2、余弦相似度算法:
在这里插入图片描述
计算出相似度系数之后在通过公式计算用户 u 对未评分商品的预测分值:
在这里插入图片描述
下面举一个基于用户计算未评分的预测值的例子:
假设有如下电子商务评分数据集,预测用户 C 对商品 4 的评分:
在这里插入图片描述

计算过程:

在这里插入图片描述
在这里插入图片描述
通过这种方法我们就可以对用户未评分的商品进行评分预测了,进而向该用户推荐频分较高的相关产品。
图1中‘?’表示该用户未对该商品进行评分,‘/’之后的表示我们通过算法计算出来的预测值。

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值