因子分解机FM
Logistics Regression
这是最基本的一个模型LR , 这个模型就是将item的一些特征进行线性组合(或者通过一层全连接的线性层)
公式如下
x表示item的一些特征, w表示权重系数
这其实就是一个一层的神经网络, 这个只考虑的每一个特征 , 并没有考虑特征之间的一些关系,所以二阶的poly2出现了。
poly2
将特征进行暴力组合,
w
i
j
w_ij
wij表示两个特征的关系系数。
缺点:时间复杂度变成了 n 2 n^2 n2 , 以及用one-hot编码, x i x j x_ix_j xixj 相乘后特征变得非常稀疏。
FM
FM模型赋予每一个特征一个特征项向量, 这就解决了特征相乘后稀疏的问题,。
另一方面, 模型可以化简,从而复杂度得到提升。
ps:这里只考虑了item的特征, 也就是说他对所有的用户都是一样的, 因此可以在特征中加入用户的特征进行综合处理
参考:https://blog.csdn.net/realnuannuan/article/details/93401214