阿里CTR预估三部曲(1):Deep Interest Network for Click-Through Rate Prediction
Introduction
CTR预估是工业应用中的重要任务,最近兴起的模型基本都是遵循embedding&MLP范式的。也就是将高维稀疏向量首先映射成低维的embedding向量并转换成固定长度的向量,最后将所得向量串联在一起经过MLP学习到特征间非线性关系后输出结果。但是这个很明显,对于不同的candidate来说,其所得表示向量是一致,导致无法捕捉到用户多样的兴趣。因此阿里提出了DIN。同时提出了一种新的激活函数Dice以及一个减少计算量的正则化函数。
DIN
Feature Representation
CTR预估的输入向量一般是高维稀疏向量。下面是一个列子:
都是所谓的one-hot或multi-hot的向量。
而整个输入空间则如图所示:
Base Model
base model 如下: