FM模型——推荐系统
●基于pytorch
●原理
●公式推导
●https://blog.csdn.net/qq_38253837/article/details/112646966
●使用矩阵分解法对二阶特征交叉权重矩阵进行分解
●代码
●使用embedding
●embedding可以看做一个特别的linear,其原理是基于矩阵乘法,可以对one-hat数据进行linear操作
●https://blog.csdn.net/qq_38253837/article/details/116228925
●不使用embdding
●https://blog.csdn.net/qq_38253837/article/details/112646966
●计算LOSS:
●二元交叉熵:nn.BCELoss
●优点
●FM前身特征交叉(POLY2模型)的缺点
●使原本稀疏的特征向量变得更加稀疏,导致大部分交叉特征权重缺乏有效数据进行训练,从而难以收敛
●权重参数数量由n上升到了n^2,极大地增加了训练开销
●将交叉特征权重数目由n^2降至n*k,极大地降低了训练开销
●隐向量的引入很好地解决了数据稀疏问题
●泛化能力大大提升,甚至可以对从而出现过的特征组合计算其权重
●实时性和灵活,推断过程简单,使其更容易进行线上部署