基于SVD++隐语义模型的信任网络推荐算法

本文针对推荐系统中数据稀疏和冷启动问题,提出了基于SVD++的隐语义模型,并结合信任网络中的显式和隐式信任关系进行推荐算法设计。通过融合邻域模型,优化评分预测效果。实验表明,所设计的算法在Epinions数据集上提高了评分预测准确性,尤其在冷启动场景下表现优越。
摘要由CSDN通过智能技术生成

点击上方蓝字关注我们


基于SVD++隐语义模型的信任网络推荐算法

陈佩武1, 束方兴2

1 平安科技(深圳)有限公司,广东 深圳 518031

2 北京大学互联网研究院(深圳),广东 深圳 518055

 

 摘要推荐算法通常基于用户的行为数据进行建模,然而显式行为数据的稀疏性可能会引起推荐算法的冷启动问题。为了降低数据稀疏和冷启动问题对推荐算法效果的影响,在已有显式信任关系的基础上,基于用户相似度引入隐式信任关系,通过SVD++隐语义模型设计了新的推荐算法。为了提升算法效果,进一步融合邻域模型,推导出算法评分预测式及损失函数。在Epinions开源数据集中将RMSE和MAE作为测试指标,在全体用户集和冷启动用户集上进行对比实验。实验结果显示,设计的推荐算法可以在一定程度上改善原推荐算法的冷启动问题,并取得更好的评分预测效果。

关键词推荐算法 ; 隐语义模型 ; 信任网络 ; 评分预测

论文引用格式:

陈佩武, 束方兴. 基于SVD++隐语义模型的信任网络推荐算法[J]. 大数据, 2021, 7(4): 105-116.

CHEN P W, SHU F X. A recommender algorithm based on SVD ++model under trust network[J]. Big Data Research, 2021, 7(4): 105-116.


1 引言

随着互联网技术的全面发展,海量数据得以产生,推动人类社会从信息匮乏的时代走入了信息过载的时代。作为解决信息过载问题的利器,推荐系统受到各大互联网公司以及研究机构的青睐。作为推荐系统的核心,推荐算法成为研究的关键和热点。然而传统的推荐算法(如协同过滤(collaborative filtering,CF)算法)存在评分数据库的数据稀疏性和用户偏好信息数据有限等问题,即推荐系统的数据稀疏和冷启动问题。以上问题会制约推荐系统的推荐效果,破坏用户体验。为了缓解数据稀疏和冷启动问题,通常会在推荐系统中引入新维度的数据。然而近年来,社交网络的快速发展给推荐算法的研究带来了新的推动力。在社交网络中,用户不但会展示自己的个性和偏好,还会与偏好类似、相互信任的其他用户构建联系。因此如何进一步在社交网络的研究中利用社会化信息进行信任构建,提升推荐算法的有效性,成为一个重要的研究课题。

隐语义模型(latent factor model, LFM)最早是在文本挖掘邻域被提出的,其主要被用来寻找文本中的隐含语义。虽然学术界已经提出了多个基于隐语义模型改进的推荐算法,但是信任网络中还少有以隐语义模型为基础进行改进的推荐算法,且效果并不理想。为了优化推荐算法的效果,本文采用以隐语义模型为基础,与其他模型融合的思路进行推荐算法设计。另外,评分预测(rating prediction)也是推荐系统研究的关键问题,即通过已知的用户历史评分记录来预测未知的评分。因此,基于隐语义模型与其他模型融合设计推荐算法,并从评分预测的角度进行实验验证,具有重要的研究意义和实用价值。本文结合信任网络的特点与用户关系数据进行建模,基于用户之间的相似度设定用户之间的隐式信任关系,结合显式信任关系与评分等数据一起进行预处理,生成矩阵。在隐语义模型选择方面,本文借鉴奇异值分解(single value decomposition, SVD)++模型,结合信任网络的特点进行改进,并融合邻域模型,设计了推荐算法的评分预测函数和损失函数,利用随机梯度下降算法进行迭代求导,得到优化后的推荐算法评分预测值。之后本文在Epinions开源数据集上进行离线对比实验,验证了本文设计的推荐算法在信任网络中的推荐效果优于其他对比算法,对于解决推荐系统的冷启动问题有良好效果。

本文主要的贡献如下。

● 与传统仅基于用户的物品评分记录的推荐算法以及相关模型相比,本文加入了信任网络背景,通过对信任网络特点和用户行为进行分析,将用户反馈数据分为隐式行为数据和显式行为数据,并进行整合,利用信任信息对推荐算法的评分效果进行改善。

● 在信任网络的研究背景下,本文借鉴SVD++隐语义模型进行推荐算法的设计和实现,融合显式信任因子及隐式信任因子优化算法的推荐评分预测效果。

● 本文以隐语义模型为算法基础,借鉴了基于邻域模型的推荐算法思想,将两种模型从全局优化的角度进行融合,并从评分预测的角度对推荐算法设计了对比实验。本文使用评测指标平均绝对误差(mean absolute error,MAE)和均方根误差(root mean square error,RMSE)分别在冷启动数据集和全体数据集中对比加入信任关系前后的SVD++算法的效果,从而证明信任网络的加入对原有推荐算法的提升效果。然后将本文设计的推荐算法与其他信任网络下的典型算法进行对比测试,并证明了本文设计的算法在评分预测问题上的优势。

2 研究背景

2.1 推荐系统的发展

针对推荐系统的研究开始于20世纪90年代,随着网络的普及,该技术被逐步应用到各个行业。推荐系统主要由用户建模部分、推荐对象建模部分以及推荐算法部分共同组成,其中推荐算法部分是整个推荐系统的核心,也是研究的关键和热点。目前被广泛使用的协同过滤推荐算法来源于Tapestry和GroupLens系统的论文,该算法被用于邮件和新闻的过滤。协同过滤算法也被称为基于邻域模型的推荐算法,即邻域实质相似项的集合。用户间存在相似的兴趣,或者某些物品间存在相似的特征,因此基于邻域的推荐算法又被分为两类:基于用户的协同过滤(UserCF)推荐算法和基于物品的协同过滤(ItemCF)推荐算法。UserCF算法主要包括两

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值