FM用于CTR预估

三环茅草屋

于 2019-10-14 11:50:43 发布

阅读量337

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44070747/article/details/102545135

版权

参考：https://tech.meituan.com/2016/03/03/deep-understanding-of-ffm-principles-and-practices.html

《推荐系统算法实践》P115

FM常用于CTR预估，其可以看成是对逻辑回归的优化，使得逻辑回归也可以用机器来做特征工程。

其主要目标是在数据稀疏的情况下，用模型来做特征交叉。（特征交叉可以发掘特征之间的关联性）目标解读：我们假设一个场景：数据包含用户id，性别，年龄，地区特征来预测对口红的点击率。如果性别为女而且年轻，那么他对口红的点击率应该高，这说明性别和年龄有关联，需要在多项式后，加一项（系数ax1x2），这就是特征交叉，让模型把这个当成新的特征，理解为年轻女性，那么这项系数应该是比较大的。但是现实中的数据可能年轻女性比较少，只有当女性和年轻两个特征都为1的数据才能用来训练系数a，数据过少导致系数a的值不精确。这就是人工特征+LR的不足之处。FM来解决这个问题。

在这里插入图片描述

上图为人工特征工程+LR的公式，其中的wij为W矩阵的一项，W矩阵记录了所有特征之间的交叉系数。我们将W矩阵分解，得到的向量点击后就可以复原W矩阵中的任何一项。变成下式：

在这里插入图片描述

由于矩阵分解，需要学习的参数就大大下降了。而且解决了数据稀疏的问题。

那么这里的Vi就是第i个特征的隐向量，每个特征都要一个自己的隐向量，这个是通过矩阵分解得到的，而且这个向量可以是多维度*多维度的，像下图：

在这里插入图片描述

三环茅草屋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
FM用于CTR预估

参考：https://tech.meituan.com/2016/03/03/deep-understanding-of-ffm-principles-and-practices.html《推荐系统算法实践》P115FM常用于CTR预估，其可以看成是对逻辑回归的优化，使得逻辑回归也可以用机器来做特征工程。其主要目标是在数据稀疏的情况下，用模型来做特征交叉。（特征交叉可以发掘特征之间的关联性）...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。