Deep Match to Rank,其思想是使用DeepMatch方法来捕捉用户和商品的交叉特征,从而提升Ranking模型的个性化能力。
我们根据协同过滤中的U2I CF和I2I CF构建了两个子网络来表征U2I相关性。User-to-Item网络通过内积直接表征U2I相关性,相当于DeepMatch方法中的匹配网络。而Item-to-Item网络通过计算I2I相似度间接表征U2I相关性。
受factorization方法的启发,我们用user representation和item representation的内积来表征U2I相关性。user/item representation和user对item的偏好度,是通过DeepMatch方法中的匹配网络,也就是这里说的User-to-Item网络,来实现的。
DNN4YouTube就是一种DeepMatch方法,将召回问题建模为大规模分类问题。基本思想是使用各种用户行为序列、用户属性得到用户向量,使用商品属性得到商品向量,然后通过匹配(内/外积)用户和商品向量,得到用户对商品的偏好度。用户和商品向量都是由不同特征的embedding concat在一起的。
此外,我们知道在搜索推荐中,用户行为具有如下特征:
- 用户最近的浏览行为对下一个浏览的商品有着重要影响,因为用户在一个session下,浏览的商品具有很高的相似性,而且越近的行为一般影响会越大。
- 不同行为,比如收藏、加购、下单,对下一个浏览行为的影响程度不同。相比一个只是被浏览的商品,一个被加入购物车的商品对用户下一个要浏览的商品的影响可能会更大些。
- 用户浏览商品的时间,对下一个浏览行为的影响程度也不同。一个停留时间越长的商品,对用户下一个要浏览的商品的影响可能会更大些。
所以我们将每个商品在行为序列中的位置、用户在商品详情页的停留时长、用户和商品的交互行为类型,作为三个上下文特征,用于描述行为序列中商品的重要性(具体attention计算方式参考Bahdanau论文),大家可自行百度。通过这种方式我们可以将浏览商品时间的远近、交互行为的类型,以及浏览商品停留时长对下一个要浏览的商品的影响建模出来。
DMR提供了一个Matching和Ranking联合训练的框架,用户和商品偏好度表征的模块可以很容易地嵌入到现有的CTR模型中,相当于向原来的模型中加入一些有效的特征。