（毕设）协同过滤算法的优化

最新推荐文章于 2024-07-08 22:12:26 发布

给小爷沏杯茶

最新推荐文章于 2024-07-08 22:12:26 发布

阅读量228

点赞数

文章标签：算法聚类

本文链接：https://blog.csdn.net/zhuruiya/article/details/129060725

版权

传统协同过滤算法所面临的问题：

冷启动问题:

基于内容的最近邻居查找技术
1)利用聚类技术将用户按照属性相似性聚类，从项目属性的角度找到新项目的最近邻居
2)用新项目k的所有最近邻居的平均评分来代替已有评分的平均值

用户-项目矩阵的稀疏性问题：

矩阵填充技术：采用预测评分的方法，BP神经网络（缺点是随着训练时间的增加，收敛速度有变慢的趋势，以致于演唱了最近邻居的查找时间）和基于内容的预测（缺点是无法计算跨类别的评分预测）
奇异值分解

评估方法：

统计精度度量（所用方法为平均绝对偏差MAE，平均绝对偏差（MAE）通过计算预测的用户评分与实际的用户评分之间的偏差度量预测的准确性，MAE越小，推荐质量越高）
决策支持精度度量（召回率（Recall）反映了待推荐项目被推荐的比率，准确率表示算法推荐成功的比率，ROC有两个指标，sensitivity和specificity前者为任选一个用户喜欢的项目，该项目被推荐的概率，后者为任选一个用户不喜欢的项目，该项目被推荐的概率）

传统的用户相似性度量方法：

主要包括余弦相似性，相关相似性，修正的余弦相似性。
（在用户评分数据极端稀疏的情况下，传统的相似性度量方法存在相应的弊端，余弦相似性中，用户没有评价过的项目定为0，这是不合理的，因为用户对未评分项目的喜好程度不可能完全相同，也不可能完全不喜欢，只是没有尝试过而已，所以在数据极端稀疏的情况下余弦和修正的余弦都存在这样的问题；而相关相似性也是针对用户之间的项目集合的交集来进行相似性度量，同样也存在数据稀疏所要面临的问题）
所以在未评分项目中我们理应采用预测形式的协同过滤算法来研究问题；

基于项目预测的协同过滤算法：

由用户对相似项目的评分来预测未评分项目的评分
1）寻找最近邻居：为了有效地解决用户评分数据极端稀疏情况下传统相似性度量方法存在的问题,本文提出在计算用户i和用户j之间的相似性时,首先计算经用户i和用户j评分的项目集合的并集Ui j,设经用户A评分的项目集合用IA表示,则Uij 为 Ui j=I i ∪Ij.
用户i和用户j在项目集合Ui j 中未评分的项目通过用户对相似项目的评分预测出来,然后在商品集合Ui j上计算用户i和用户j之间的相似性.这种方法不仅能有效地解决相关相似性度量方法中用户共同评分数据比较少的情况,而且可以有效地解决余弦相似性度量方法和修正的余弦相似性度量方法中对所有未评分商品的评分均相同的问题(均为0),使得计算出来的目标用户的最近邻居比较准确,