【CTR预估】CTR模型如何加入稠密连续型和序列型特征？-CSDN博客

“ CTR预估任务中除了广泛使用的稀疏离散型特征外，还会用到稠密连续型以及一些序列类型的特征，本文为大家简要梳理几种特征的处理方式～”

在点击率预估问题中，可以尝试的几种方法

归一化后直接输入dnn部分，不参与fm部分交叉
不归一化经过bn后输入dnn，不参与fm部分交叉
离散化后作为id feature, embedding后与其他sparse feature的embedding 一起参与fm的交叉
为每一个field下的dense value 维护一个embedding vector ,取作为其最终的embedding表示，与其他sparse feature的embedding一起参与fm的交叉,如下图右侧的Feature field M

3和4的区别在于3中根据dense value的取值会分配到不同的embedding vector，而4中的不同的dense value只有一个embedding vector

整理自浅梦在【数值类型的特征怎么加入深度模型如nfm，deepfm?】的回答https://www.zhihu.com/question/348103064/answer/878224028

这个问题抽象出来就是给定一个由若干个(item_id,weight)组成的列表，如何将这个信息用在模型里面。通常来说这种列表的含义可以是用户历史偏好的item_id以及偏好权重，或者是历史收藏加购过的商品或者对应店铺的次数等等。对于问题中的数据

一般情况有以下两种做法来使用这个信息：

回归到最简单的情况，给定一个无权序列，我们一般可以通过sum/mean pooling 的方式将一个变长序列压缩到一个定长的向量，输入给我们的模型。
那么对于带权序列，其实可以看作是一个weighted sum/mean pooling的过程，其实有点类似引入一个attention机制，只不过attention score是预先计算好的。
这种方法完整保留了用户所有的偏好信息，更多的是作为一种用户侧表征。

对于上述数据，我们得到的表示向量为(不考虑score的归一化)