序
推荐系统中常用的模型是Logistic Regression。但是其没有考虑特征之间的相互关系,如果要使得模型学到这种相互关系的能力,则必须手动制作相应的相关特征,工作量巨大;为了解决这个问题,使用FM,FFM对组合特征进行学习;然而FM,FFM只考虑了低阶特征的组合,并未考虑高阶特征的组合,所以一种合理的思路就是使用Deep+FFM的组合模型,即为接下来要介绍额DeepFM模型。
推荐系统中的CTR预估是预测用户点击推荐物品的概率。大部分推荐系统的目标是最大化点击次数,因此要推荐给用户的物品的排序策略,直接按预估的CTR大小排序即可;但在其他场景如在线广告,目标是最大化收益,因此排序策略调整为按所有候选item的CTR*bid,bid是item被user点击后系统的收益。两种场景的关键都是要准确预估CTR。
FM
参见为知笔记《ZJ_FM》
DeepFM
FM考虑了低阶特征的组合问题,但是无法解决高阶特征的挖掘问题,所以才引入了DeepFM。DeepFM是一个集成了FM和DNN的神经网络框架,思路和google的Wide&Deep有相似的地方,Wide&Deep包括wide和deep两部分,其中wide部分是高维线性模型,DeepFM的wide部分则是FM模型;二者的deep部分都是dnn层。 DNN隐藏层的激活函数用ReLu和Tanh,Sigmoid函数做CTR预估的输出函数。