(毕设)协同过滤算法的优化

传统协同过滤算法所面临的问题:

冷启动问题:

基于内容的最近邻居查找技术
1)利用聚类技术将用户按照属性相似性聚类,从项目属性的角度找到新项目的最近邻居
2)用新项目k的所有最近邻居的平均评分来代替已有评分的平均值

推荐速度:

通常采用聚类技术来大大缩小用户或项目的最近邻居搜索范围

用户-项目矩阵的稀疏性问题:

矩阵填充技术采用预测评分的方法BP神经网络(缺点是随着训练时间的增加,收敛速度有变慢的趋势,以致于演唱了最近邻居的查找时间)和基于内容的预测(缺点是无法计算跨类别的评分预测)
奇异值分解

推荐策略:

平均加权策略(缺点是在用户评价过的项目数量较多时合理,当用户评价过的项目数量较少时,个别项目的评分就会对平均评分有较大影响)
基于评分频度的推荐策略(在用户评价的项目数量较少时,推荐效果优于平均加权策略)

评估方法:

统计精度度量(所用方法为平均绝对偏差MAE,平均绝对偏差(MAE)通过计算预测的用户评分与实际的用户评分之间的偏差度量预测的准确性,MAE越小,推荐质量越高)
决策支持精度度量召回率(Recall)反映了待推荐项目被推荐的比率,准确率表示算法推荐成功的比率,ROC有两个指标,sensitivity和specificity前者为任选一个用户喜欢的项目,该项目被推荐的概率,后者为任选一个用户不喜欢的项目,该项目被推荐的概率)

传统的用户相似性度量方法:

主要包括余弦相似性相关相似性修正的余弦相似性
(在用户评分数据极端稀疏的情况下,传统的相似性度量方法存在相应的弊端,余弦相似性中,用户没有评价过的项目定为0,这是不合理的,因为用户对未评分项目的喜好程度不可能完全相同,也不可能完全不喜欢,只是没有尝试过而已,所以在数据极端稀疏的情况下余弦和修正的余弦都存在这样的问题;而相关相似性也是针对用户之间的项目集合的交集来进行相似性度量,同样也存在数据稀疏所要面临的问题)
所以在未评分项目中我们理应采用预测形式的协同过滤算法来研究问题;

基于项目预测的协同过滤算法:

由用户对相似项目的评分来预测未评分项目的评分
1)寻找最近邻居:为了有效地解决用户评分数据极端稀疏情况下传统相似性度量方法存在的问题,本文提出在计算用户i和用户j之间的相似性时,首先计算经用户i和用户j评分的项目集合的并集Ui j,设经用户A评分的项目集合用IA表示,则Uij 为 Ui j=I i ∪Ij.
用户i和用户j在项目集合Ui j 中未评分的项目通过用户对相似项目的评分预测出来,然后在商品集合Ui j上计算用户i和用户j之间的相似性.这种方法不仅能有效地解决相关相似性度量方法中用户共同评分数据比较少的情况,而且可以有效地解决余弦相似性度量方法和修正的余弦相似性度量方法中对所有未评分商品的评分均相同的问题(均为0),使得计算出来的目标用户的最近邻居比较准确,

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值