运用领域:
序列推荐,即进行集合分析时,不但要考虑用户交互过什么物品,还要考虑用户交互这些物品的顺序。
方法简介:
综合了FISM模型(Factored Item Similarity Models)和马尔可夫链两种方法。
马尔可夫猜想大致可以理解为:当前状态只和前几个状态有关(短时性)
符号表(Notations):
出现了一些新的符号,解释如下:
:用户u的交互序列,按照交互先后顺序排序。
意为用户u第t个交互的物品。
L:马尔可夫链的长度,即每次进行状态预测时最多考虑前L个状态。
两个关于马尔可夫链的权重:
:描述马尔可夫链中状态对当前状态的影响大小,即权重大小。
:描述马尔可夫链中状态对某个用户当前状态的影响大小,即权重大小。
是一个个性化参数,因为对于不同的用户权重肯定不同。比方说买东西,用户a买的前L个东西都很喜欢很重要,而用户b买的前L个东西中有一些是帮别人买的,那么两个用户的权重向量
肯定就不一样了。
而是一个全局化参数,他的大小是由训练集里所有用户一同决定的。
这两个权重都要通过训练学习获得
预测公式(Prediction Rules)
式(1)形式和FISM方法基本一致,该方法的创新点为式(2)
式(2)的前一项就是FISM的预测公式(FISM的对比图如下)
而式(2)的后一项结合了马尔可夫链,即预测当前状态时,需要考虑前L个状态。
将前L个潜在特征向量W加权和,就能够体现马尔可夫链的思想(权重就是符号表中解释的和
)
训练时,我们挑选负样本进行训练。
而在测试时,我们相当于预测第个物品,所以马尔可夫链部分的前L个状态实际上指的是
的最后L个状态。
损失函数
损失函数如下图所示
在原论文中,负样本的定义是除去马尔可夫链中物品之外的所有物品。
但是我们可以简单的将视为负样本。
接下来按照梯度下降进行训练即可