Leveraging Social Connections to Improve Personalized Ranking for Collaborative Filtering
本文介绍Irwin King教授团队的博士生和Julian McAuley合作的一篇文章,文章发表与CIKM2014。文章主要研究的问题是,如何利用社交关系来提升社交网络中单类反馈数据的个性化排序精度。
文章主要思想介绍
这篇文章主要做的事情是利用用户的社交关系来提升推荐的效果,针对的是隐反馈数据集,也就是所谓的one class collaborative filtering,单类协同过滤问题。
文章声称的一个创新点在于他们揭示了用户对某些产品的偏好如何通过他们朋友选择的产品来表现。
因此作者首先对4个数据集进行了简单的分析,这四个数据集包含用户的偏好数据和用户的社交关系数据。作者给出了两个统计图:第一个统计图表明某个项目被用户选择同时被他的好友选择的概率远远高于某个项目被一个用户同时被另外随机抽样的用户同时选择的概率和某个用户选择的项目属于一个随机抽样的产品集合的概率。第二个统计图表明当选择某件产品的好友个数增加时,用户选择该产品的概率也随之增加。基于该思想,这篇文章提出应该按照如下的思路对产品进行排序:
模型假设
与传统协同过滤算法将产品全集分为正向反馈和负向反馈两种不同,作者将产品全集分为三类:第一类是正向反馈 Pu ,也就是用户选择过,购买过或者评论过的产品;第二类是社交圈反馈 SPu ,也就是那些用户没有观察到的,但是用户的朋友中至少有一个看到的产品;第三类是负向反馈 Nu ,这类产品是用户看不到,用户的社交圈也看不到的产品集合。(可结合后面的问题定义来看)
然后根据
这一思想作者给出了如下假设:
其中 xui 表示的是用户对产品 i 存在正向反馈,