简介
目前存在的推荐系统主要分为两种:
1.基于内容的推荐系统
方式:通过分析单个用户或资源的原始信息来进行推荐;
优点:对于稀疏性有一定的抵抗能力;
缺点:只能发现与已有兴趣相似的资源,难以挖掘新的感兴趣资源;
2.基于协同过滤的推荐系统
方式:基于历史上多个用户的访问信息对用户群体的喜好进行分析最后推荐使用者可能感兴趣的资源;
优点:能有效挖掘出新的感兴趣的资源,且无需考虑资源的表示形式;
缺点:对于稀疏性高的数据,系统性能会大大降低;
图模型
大多数的推荐算法都面临数据稀疏性问题,图模型的算法能明显的改进稀疏性问题、提高推荐准确度。
图模型:
(图有小问题,表达意思即可)
图模型的构造:
用户对资源进行评分行为可以看作一种联系,表达了用户对资源的偏好。
对这种联系建立模型,把用户和资源表示成图中的点,如果用户使用过某资源,则在该用户和资源之间连边,把评分作为边的权值。
加入用户的背景信息:
用户背景信息是很强的社会信息,用户的背景能够决定用户对信息资源的需求。背景信息相同的人可能对资源有相似的偏好。
计算:
使用带重启机制的随机游走算法(Random Walk with Restart),计算一个用户到其他所有用户的相关度。
RWR算法:算法从图中某个顶点出发,沿图中的边随机游走。在任意点上,算法以一定的概率随机地选择与该顶点相邻的边,沿这条边移动到下一个顶点,或以一定的概率直接回到出发点。对于一个非周期不可约的图,经过若干次随机游走过程,到达图中每一个顶点的概率值达到平稳分布,再次迭代也不改变图中的概率分布值。此时,图中每个点的概率值可以看作该顶点与出发点的联系紧密程度。
推荐计算过程:
1.
把需要得到推荐的用户顶点作为出发顶点
;
2.
在
RWR