这篇文章主要考虑的是用户属于社交网络中多个兴趣社区的情况。利用这种信息来正则化社交矩阵分解,作者称之为重复社区正则化(overlapping community regularization)。
重复社区正则化
重复社区
一个用户属于多个社区,代表用户多样化的兴趣。
社区的评分向量:社区中所有评分向量的均值。用户
ui
对社区
ch
的兴趣
Zih
是用户
ui
的评分向量和社区
ch
的评分向量之间的皮尔逊相关系数。
MFC Model
SocialRec模型[Ma Hao]通过对用户以及他们的好友进行相似度约束提升评分预测效果。给定社交网络,SocialRec模型可以很容易地扩展到考虑用户所属的社区的所有成员。不过基于用户到用户的相似度约束考虑个体的影响可能会导致过拟合。
作者提出的MFC模型,对SR模型用社区兴趣进行约束。作者的出发点(动机)在于属于不同社区的用户应该被不同对待,但是之前的SocialRec模型却将它们同等对待。如果目标用户对音乐比体育更感兴趣,那么属于音乐社区的用户应该获得的权重更高。在MFC中,用户
ui
的隐特征依赖于与用户
ui
属于相同社区的用户。MFC中的正则化项考虑了用户相似度
Sik
和社区兴趣
Zih
:
其中 MUih 包含与用户 ui 同属一个社区 ch 的用户,如果用户 ui 属于 ch 那么 IZih 等于1,否则为0。待最小化的目标函数E及求参数的方法这里就省略了。
MFC+ 模型
在实际生活中,用户通常会向不同群组的成员寻求建议,并将群中不同成员的建议汇总为一个总建议。例如,John在一个基于社交的电影推荐系统中参加了两个群组,Comedy和Romance,他想要在周末看一部电影。在读完评论后,他选择了这两个群中平均评分较高的Four Weddings和 A Funeral。
图5所示的
MFC+
模型,基于目标用户
ui
所属的社区的隐特征学习目标用户的隐特征。社区
ch
的隐特征
Ch
基于属于
ch
的用户和这些用户对
ch
的兴趣定义。