深度学习推荐系统学习笔记--Chapter 2.2

最新推荐文章于 2023-04-13 11:59:53 发布

Jiede1

最新推荐文章于 2023-04-13 11:59:53 发布

阅读量234

点赞数

分类专栏：推荐系统机器学习文章标签：机器学习推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiede1/article/details/106803722

版权

机器学习同时被 2 个专栏收录

50 篇文章 9 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

章节2

总共包含两篇博文：
深度学习推荐系统学习笔记–Chapter 2.1
深度学习推荐系统学习笔记–Chapter 2.2
本文是其中一篇

逻辑回归模型的表达能力不够强大，会造成信息的损失，无法做很灵活的特征交叉。因此诞生了FM模型家族，加入了大量的特征交叉思想。

因子分解机(Factorization Machine, FM)是由Steffen Rendle提出的一种基于矩阵分解思想的机器学习算法，FM的提出是为了解决大规模稀疏数据中的特征组合问题。
在这里插入图片描述

POLY2模型

$\sum^n_{j1=1}\sum^n_{j2=j1+1} w_{h(j1,j2)}x_{j1}x_{j2}$

POLY2模型对所有的特征组合都赋予一个单独的权重 $w_{h(j1,j2)}$ ，但在处理互联网数据时候，输入数据很大程度是one-hot类型，因而特征向量会变得非常交叉，导致大部分交叉特征的权重缺乏数据训练，无法收敛。
并且，这样也增大了训练的复杂度，因为权重参数数目巨大。

FM模型

在这里插入图片描述

FFM模型

在FM的基础上，加入了特征域感知的概念。
$\sum_{j1=1}^n \sum^n_{j2=j1+1} (w_{j1,f2} * w_{j2,f1})x_{j1}x_{j2}$

f1，f2是不同的特征域。此时每个特征所对应的隐向量不再是 $R^n$ ，而是 $R^{n*f}$ 。

FMM的复杂度已经上升到 $kn^2$ ，但同时模型的表达能力也变强了。所以在工程化的时候，需要在模型效果和算力消耗上做出取舍。

GBDT+LR

FFM确实提高了模型的特征交叉能力，但是计算量巨大。GBDT+LR能够做到在计算量可控的情况下，做到特征组合和筛选。

GBDT用于构建特征工程，LR用于预估CTR。

GBDT基本机构是由决策树组成的树木，学习的方式为梯度提升。GBDT通过逐步生成决策子树的方式生成整个树林，生成新子树的方法为，利用样本标签与当前预测值之间的残差，构建新的子树。

每棵树生成的过程为标准的回归树生成过程，单棵树中节点的分裂是一次自然的特征选择过程，而多层节点结构则进行了有效的自动组合。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习推荐系统学习笔记--Chapter 2.2

承接深度学习推荐系统学习笔记–Chapter 2.1一文逻辑回归模型的表达能力不够强大，会造成信息的损失，无法做很灵活的特征交叉。因此诞生了FM模型家族，加入了大量的特征交叉思想。因子分解机(Factorization Machine, FM)是由Steffen Rendle提出的一种基于矩阵分解思想的机器学习算法，FM的提出是为了解决大规模稀疏数据中的特征组合问题。POLY2模型POLY2=∑j1=1n∑j2=j1+1nwh(j1,j2)xj1xj2POLY2 = \sum^n_{j1=1.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。