传统的协同过滤

一:几种不同的推荐算法概述

1. 传统的协同过滤推荐通过用户的最近邻居产生最终的推荐,基于项目的协同过滤推荐首先计算项目之间
的相关性

的相关性 , 然后通过用户对相关项目的评分预测用户对未评分项目的评分
2. Bayesian 网络技术利用训练集创建相应的模型 [7] , 模型用决策树表示 , 节点和边表示用户信息 . 训练得到的
模型非常小
, 所以对模型的应用非常快 . 这种方法适合于用户的兴趣爱好变化比较慢的场合
3. 聚类技术将具有相似兴趣爱好的用户分配到相同的簇中 [8,9] , 聚类产生之后 , 根据簇中其他用户对商品的评
价预测目标用户对该商品的评价
. 由于聚类过程离线进行 , 所以在线的推荐算法产生推荐的速度比较快 .
4. 关联规则技术在零售业得到了广泛的应用 , 关联规则挖掘可以发现不同商品在销售过程中的相关性 . 基于
关联规则的推荐算法根据生成的关联规则模型和用户当前的购买行为向用户产生推荐
[10] . 关联规则模型的生
成可以离线进行
, 因此可以保证有效地推荐系统的实时性要求 .
5. Horting 图技术是一种基于图的方法 [11] , 节点代表用户 , 边代表两个用户之间的相似度 . 在图中搜索近邻节
, 然后综合近邻节点的评分形成最后的推荐 .Horting 图技术可以跳过中间节点寻找最近邻居 , 考虑了节点之

间的传递相似关系.因此,推荐精度优于最近邻协同过滤技术 。

针对数据的极端稀疏性问题, 通过奇异值分解 (SVD) 减少项目空间的维数 , 使得用户在降维后
的项目空间上对每一个项目均有评分
, 实验结果表明 , 这种方法可以有效地解决同义词 (synonymy) 问题 , 显著地
提高推荐系统的伸缩能力
. 但降维会导致信息损失 , 降维效果与数据集密切相关 , 在项目空间维数很高的情况
, 降维的效果难以保证

二:传统的相似性度量方法

度量用户间相似性的方法有多种,主要包括3中方法:余弦相似性、相关相似性、修正的余弦相似性。

1:余弦相似性:


2:相关相似性: 相关相似性 (correlation): 设经用户 i 和用户 j 共同评分的项目集合用 I ij 表示 , 则用户 i 和用户 j 之间的相
似性
sim ( i , j ) 通过 Pearson 相关系数度量 :

3:修正的余弦相似性


传统相似性度量方法分析

随着电子商务系统规模的扩大,用户数目和项目数目呈指数级增长,用户评分数据极端稀疏.在大型电子商
务系统中,用户评分的项目一般不会超过项目总数的 1%[6],经两个用户共同评分的项目则更少.在用户评分数
据极端稀疏的情况下
,传统的相似性度量方法存在相应的弊端.下面我们详细分析传统的相似性度量法在用户
评分数据极端稀疏情况下存在的问题
.

三:基于项目评分预测的协同过滤推荐算法

由于用户评分数据的极端稀疏性,传统的相似性度量方法不能有效地计算目标用户的最近邻居,协同过滤
推荐系统的推荐质量难以保证
.为了解决用户评分数据的极端稀疏性,最简单的办法就是将用户对未评分项目
的评分设为一个固定的缺省值
(一般设为评分域的中间值,如在 5 分制评分中设为 3),或者设为用户的平均评分,
实验表明,这种改进方法可以有效地提高协同过滤推荐系统的推荐精度[1]
用户对相似项目的评分预测
用户对未评分项目的评分
,使得用户之间共同评分的项目比较多,从而可以有效地解决用户评分数据极端稀疏
情况下传统相似性度量方法存在的不足
,使得计算得到的目标用户的最近邻居比较准确.












  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值