在推荐系统及广告系统中,ctr预估是极其重要的一部分,解决该问题的经典模型分别为:LR、gbdt、xgboost、FM、wide&deep、deepFM、DCN、xdeepFM、DIN、DIEN、DISN。本文先介绍FM(因子分解机)算法。
一、 FM原理:
除了特征的线性组合,FM主要是引入了二阶特征交叉,通过将特征映射为隐向量,求两个特征对应的隐向量的内积完成二阶特征交叉,无需做人工的特征工程。
正向传播:
其中,为第个特征对应的隐向量,loss公式的解释为:sigmoid函数的loss的计算方式
时间复杂度优化: