推荐系统算法系列（一）：FM算法

最新推荐文章于 2024-04-24 17:14:10 发布

VIP文章预知梦_

最新推荐文章于 2024-04-24 17:14:10 发布

阅读量2k

点赞数 1

分类专栏：推荐系统文章标签：推荐系统机器学习深度学习 FM 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Im_Chenxi/article/details/102473762

版权

一、FM算法背景

在计算广告和推荐系统中，CTR预估是非常重要的一个环节，判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。

在进行CTR预估时，除了单特征外，往往要对特征进行组合，对于特征组合来说，业界现在通用的做法主要有两大类：FM系列与Tree系列。实际工程中通常是高维稀疏矩，直接特征交叉会导致计算量过大，特征权值更新缓慢。

而FM的优势就是对这两方面问题的处理：首先是特征组合，通过对两两特征组合，引入交叉项特征，提高模型特征能力；其次是维度灾难，通过引入对参数矩阵进行矩阵分解，对参数的计算节省资源。

FM是在逻辑回归上面衍生出来的，如果对逻辑回归最朴素的特征组合就是二阶笛卡尔乘积，这样暴力组合的问题：

两两组合导致特征维度灾难；
组合后的特征不见得都有效，事实上大部分可能无效；
组合后的特征样本非常稀疏，即组合容易，但是并不能在样本中找到对应的组合出现，也就没办法在训练时更更新参数。

二、FM算法原理

包含了特征两两组合的逻辑回归线性部分就是： $\omega_0+\sum_{i=1}^n\omega_ix_i+\sum_{i=1}^{n}\sum_{j=i+1}^{n}w_{ij}x_ix_j$ 。

与线性模型相比，FM的模型就多了后面特征组合的部分。和原始的逻辑回归相比，就多出来了特征两两组合部分，也需要去学习对应的参数权重。

因为逻辑回归在做特征组合时样本稀疏，从而无法学到很多特征组合的权重，所以FM的思想就是对特征两两组合的逻辑回归线性部分公式中的 $w_{ij}$ 做解耦，让每一个特征学习一个隐因子向量出来。如果学习

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
推荐系统算法系列（一）：FM算法

推荐系统算法系列（一）：FM算法一、FM算法背景在计算广告和推荐系统中，CTR预估是非常重要的一个环节，判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。在进行CTR预估时，除了单特征外，往往要对特征进行组合，对于特征组合来说，业界现在通用的做法主要有两大类：FM系列与Tree系列。实际工程中通常是高维稀疏矩，直接特征交叉会导致计算量过大，特征权值更新缓慢。而FM的优势就是对这两...
复制链接

扫一扫

专栏目录

博客等级

码龄6年

32
原创

44
点赞

126
收藏

9
粉丝

关注

私信

热门文章

分类专栏

最新评论

TensorFlow指定GPU设备、分配显存
Tisfy: 我曾经流连于宋元的词曲，但刚发现此文甚妙！
利用TensorFlow构建神经网络的一般步骤及常用方法和函数
weixin_46313564: 年轻人不讲武德！！！你讲的也太好了，很多我见过，却没有留意深思的东西都在你这里见到了。完美的概括了写一个完整代码的全部过程！！！如果满分是100分的话，我给你82分，再给你666！！！多谢多谢！！！
C/C++enum枚举类型及赋值范围
Alie_zzZ: undefined
C/C++enum枚举类型及赋值范围
cheersTheDay: 我看的也是这本书，我用的是linux系统，如果枚举最大值不超过INT_MAX，那么枚举最大范围是int的最大值超出就会溢出；第10章有简单说了这个问题 c++11扩展了枚举，然后默认枚举底层类型就是int，可以定义枚举时设置 enum enumName :short 来改变底层类型
C/C++enum枚举类型及赋值范围
Crayon! 回复浮生26733: 我测试下来默认是21亿

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。