论文标题:SoCo: A Social Network Aided Context-Aware Recommender System
论文出处(会议或期刊):WWW
论文时间:2013
一、 摘要(翻译论文的摘要)
上下文与社交网络信息已经被证实对建立精确的推荐系统有重要的价值。然而,据我们所知,目前不存在有系统地结合这些信息去提高推荐质量的研究。在这篇论文中,我们提出SoCo,一个新颖的将精心处理社交网络信息的上下文感知推荐系统。我们使用随机决策树处理上下文信息,将原始的用户项目矩阵根据相似的上下文信息分组。然后使用矩阵分解技术对生成的分块矩阵的缺失值进行预测。为了结合社交网络信息,我们引入了一个社交规则到矩阵分解目标函数中,通过学习与该用户有相似品味的朋友的想法意见去推断一个用户对一个项目的偏好。一个上下文感知版本的皮尔逊相关系数用于测量用户之间的相似度。通过对真实的数据集进行实验,SoCo推荐系统(基于根平方误差)相对传统上下文推荐系统和社交推荐模型分别提升了15.7%和12.2%。
二、 相关技术(只写相关算法名称及相关解读参考网址)
1.RPMF(参考文献 Contextual collaborative filtering via hierarchical matrix factorization )
2.SoReg(参考文献 Recommender systems with social regularization )
3.BMF(BaisSVD)
4.ItemCF
5.userCF
6.SoCo(本文提出)
三、 本文算法(本文提出的算法)
1. 算法1:
1) 名称:SoCo
2) 算法步骤:
a) 步骤一:利用随机决策树(Random decision trees)将原始用户项目评分矩阵基于不同的上下文与上下文的值进行分块。
b) 步骤二:利用加入上下文向量的评分矩阵,通过皮尔森相关系数法计算用户之间基于共同评价过的项目的相似度N(pcc),再进行正则化得到权得w
c) 步骤三:通过皮尔森相关系数法计算朋友之间的相似度S,再乘以上一步的w,得到基于上下文信息的用户相似度Sc。
d) 步骤四:根据公式利用随机梯度下降法对求出U、V矩阵用于评分。每个分块矩阵都参与U、V生成的计算,评分时求和取平均值。
3) 用于解决本文的什么问题:
2. 算法2:…
四、 实验
1. 实验数据集:
1) 数据集1:
a) 名称:Douban dataset
b) 介绍:(包括数据集是什么类型的,文件结构是如何的等等)
类型:包括电影、音乐、书的评分。
文件结构:未知
c)
d) 来源:文中表示数据集由Erheng Zhang此人中分享。
2) 数据集2:
a)名称:MovieLens
b)介绍:
包括6,040个用户对于3,900部电影的1,000,209个评分。
时间:2000年
包含ratings.dat、users.dat、movies.dat
Ratings.dat:用户id、电影id、评分(1~5)、时间标签
格式:UserID::MovieID::Rating::Timestamp
Users.dat: 性别、年龄、职位、邮编
格式:UserID::Gender::Age::Occupation::Zip-codeAll
Movies.dat:电影id、标题、流派
格式:MovieID::Title::Genres
c)来源:http://grouplens.org/datasets/movielens/
3. 评判标准:
1) 评判值:RMSE、MAE
均方根误差(Root Mean Squared Error或Root Mean Square Deviation)是测量预估值与真实值的差别的常用方法;
平均绝对差(Meam Absolute Error)常用于表示预估值与真实值的差距。
2) 相关公式:
4. 实验分析(翻译论文部分,提供图表)
用Douban dataset实验,得到以上数据,从而选择最优的参数。
由上两张图可以看出无论在有社交网络信息的Douban dataset和没有社交网络信息的MovieLens中,新提出的SoCo算法与其它们5个算法相比都优秀。