现在,大多推荐模型为了解决冷启动和稀疏问题引入社交网络中的信任关系。然而对于没有社交网络数据的场景挑战很大。社交数据的噪声和联系太弱也对结果有影响。作者提出一种既利用了显式数据和隐式数据的模型,可以在没有trust数据的情况下,从rating数据中提取社交关系,并且RMSE和MSE还可以和普通的社交推荐一样好。
大多数现有模型使用显式数据,忽视了隐式数据,其主要创新点主要在从评分矩阵中挖掘隐式的社交关系,而基础的模型则是TrustSVD,主要改进就在TrustSVD的trust矩阵上
作者利用从评分矩阵中提取出来的距离矩阵来替代信任矩阵,其它部分不变,实验结果差不多,证明implicit数据与explicit数据同样重要
提出的方法
从隐式数据中挖掘出来的社交关系有点近似于两个节点的相似度。
文章选用Hellinger distance(海明格距离)来计算两个节点的距离。选择海明格距离的原因是,这个模型的具有一定的统计性和随机性。两节点间海明格距离的计算主要依赖于两个node的领接节点的度分布概率(先将user-item化为二部图)
之后得到一个N×N的矩阵,N就是用户的数量,每一行自然就是该用户对其它用户的信任程度,距离少一个阈值就看做一个tie,其实得到的海明格距离也就是tie的强度。
在TrustSVD中,有信任矩阵T,是由truster u(委托人)和trustee v(受托人)的内积和得来的,然后再用矩阵分解的思路得到u和v的隐向量做推荐。而作者这篇文章中,作者主要是用从评分矩阵推出的implicit 数据(是一个基于海明格距离的距离矩阵)来替代TrustSVD中的信任矩阵T,其它工作与TrustSVD相同