Paper-DeepFM
-
- Introduction
- 现存方法的侧重点
- low- / high- order interactions 低阶/高阶交互
- expertise feature engineering 专业特征工程
- 关键挑战
- in effectively modeling feature interactions 有效建模特征交互
- FM中
- 使用 inner product 内积作为潜在特征向量之间的交互,效果很好
- 特征通常只考虑2层,为避免高复杂度
- 改进方法
- CNN+:更倾向于临近特征之间的交互
- RNN+:更适合有顺序的数据
- 本文方法
- DeepFM,FM+DNN
- 使用FM建模低阶特征交互,DNN建模高阶特征交互
- 不同于 wide&deep,DeepFM可以端到端训练,不需要特征工程
- 本文方法
- 概述
- (X,y) X是m域的数据记录,通常包括一对用户和物品,y∈{0,1}表示用户点击行为
- X可能包含分类字段(性别、地区)用一个one-hot编码向量表示;连续字段(年龄)用其自身值或离散化之后的one-hot编码向量表示
- 最后每个实例可以表示为(x,y),其中x由各类向量表示组成
- 任务目标:建立一个预测模型y' 估计用户点击给定内容的概率
- DeepFM
- 包含FM、deep两个部分,共享相同的输入
- 对于特征i,一个标量wi用来权衡其一阶重要性,一个潜在向量Vi用来衡量它与其他特征交互的影响。Vi喂入FM建