一个课堂汇报笔记,简单的item-item推荐算法模型分析。用到了word2vec, CF, random walk, skip-gram, embedding
先解释一下:这边item/object指代商品,user是用户。
要介绍小店基于LBS特征的相似度计算,首先我们从通用的相似度计算模型进行讲解。
目前根据现实世界信息构成的图网络主要有两种。第一种是所有节点信息对等,如每个节点都是用户、每个节点都是商品,构成的图结构。另一种是不对等的信息,比如有的节点是用户,有的节点是商品,节点间的边反映用户和商品间的信息,这样就构成了二分图网络。
这里的推荐模型用到了CF算法,也就是协同过滤算法:协同过滤算法的汇总的是所有的用户和商品之间的行为对,有点像朋友推荐,比如用户A和用户B都喜欢差不多的东西,用户B喜欢某样东西,但是用户A还没有喜欢,那么此时就将用户B喜欢的商品推荐给用户A。
下面是商品推荐的相似度构建流程。流程见图片下部
模型的输入是不同用户对于商品喜好的序列,随后将商品出现同一序列的频率作为边权重建图。
随后采用了一个不确定性模型的解法,叫随机行走。假设要给推荐一个商品a的相似商品,那么就从图上从商品a对应的节点进行随机游走,游走到任意一个节点时,首先按照概率决定是继续游走,还是停止本次游走,从初始节点开始重新游走。如果继续游走,就从该点指向的结点随机选择一个节点走至下一步。经过很多次游走的循环后,每个节点被