推荐系统笔记7-Field-aware Factorization Machines for CTR Prediction

最新推荐文章于 2024-04-12 09:57:53 发布

年少_当自强

最新推荐文章于 2024-04-12 09:57:53 发布

阅读量1.3k

点赞数

分类专栏：推荐系统机器学习

本文链接：https://blog.csdn.net/buwei0239/article/details/86760742

版权

本文详细介绍了FFM（Field-aware Factorization Machines）模型，特别强调其在点击率（CTR）预测中的优势。FFM引入了字段信息，改进了传统的FM模型，通过字段感知的方式提高模型的预测能力。文章讨论了FFM的优化问题，实验部分展示了FFM在Criteo和Avazu数据集上的优秀表现。

摘要由CSDN通过智能技术生成

本文介绍Field-aware Factorization Machines for CTR Prediction，简称为FFM，其原文Paper传送门。

摘要

计算广告中CTR预估有着很重要的作用，其中二阶映射的FM常被使用，但提出的FFM在比赛中优于FM，因此引出FFM；

一、介绍

通常用LR处理分类问题，其模型是用来解决如下最优化问题：
$\mathop {\min }\limits_w {\lambda \over 2}{\left\| w \right\|_2}^2 + \sum\limits_{i = 1}^m {\log (1 + \exp ( - {y_i}{\phi _{LM}}(w,{x_i})))}$
在LR中 $\phi(w,x)=wx$ 且 $\lambda$ 是正则化参数；其余的介绍同以前文章的介绍，就不展开叙述了，下面具体介绍FFM模型原理；

二、POLY2 和 FM模型

论文 “Training and testing low-degree polynomial data mappings via linear SVM" 提出二阶映射可以有效捕捉特征信息，其Poly2模型如下（为了偷懒，就直接截图了）：
在这里插入图片描述
其中 $h(j_1,j_2)$ 是一个将 $j_1和j_2$ 编码到自然数的函数，其时间复杂度为 ${\bar n}^2})$ ， ${\bar n}$ 是每个实例平均的非0元素个数；
FM是一个对每个特征学习隐层向量的模型，假设每个特征映射为k维隐层向量，其计算公式如下：
在这里插入图片描述
变量的数目是 $n\times k$ ，所以直接计算的时间复杂度是 ${\bar n}^2k})$ ，重写上面的公式为： ${\phi _{FM}}(w,x) = {1 \over 2}\sum\limits_{j = 1}^n {(s - {w_j}{x_j}) \cdot {w_j}{x_j}}$ 其中 $\sum\limits_{j = 1}^n { {w_j}{x_j}}$ ，此时时间复杂度变为 ${\bar n}k})$ ；为什么FM要优于Poly2呢？见