DeepRecommendationModel task3

最新推荐文章于 2024-08-14 22:29:49 发布

Riccca

最新推荐文章于 2024-08-14 22:29:49 发布

阅读量94

点赞数

分类专栏：推荐文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Riccca/article/details/115059921

版权

推荐专栏收录该内容

4 篇文章 0 订阅

订阅专栏

对于CTR问题，最有效的提升任务表现的策略是特征组合(Feature Interaction)

其他方法的局限：

DNN ：

由于离散特征需要使用one-hot编码处理，会导致维度猛增，可以将OneHot特征转换为Dense Vector。
通过增加全连接层可以实现高阶的特征组合，但是仍然缺少低阶的特征组合

FNN 和PNN

结合FM和DNN两种模型，得到FNN
在FNN中加入一个product（做内积或外积）模块，得到PNN

Wide & Deep

FNN和PNN仍然对于低阶组合特征学习的比较少，是由于DNN的全连接导致低阶特征不能在输出端有较好的表现。
所以提出了并行结构Wide&deep，但是在最后的output unit阶段，直接将
低阶和高阶特征进行组合，很容易让模型最终偏向学习到低阶或者高阶的特征，而不能做到很好的结合。

DeepFM
模型结构与原理
在这里插入图片描述

FM

在这里插入图片描述
FM Layer是由一阶特征和二阶特征Concatenate到一起在经过一个Sigmoid得到logits
$\hat{y}{FM}(x) = w_0+\sum{i=1}^N w_ix_i + \sum_{i=1}^N \sum_{j=i+1}^N v_i^T v_j x_ix_j$

Deep

在这里插入图片描述
Embedding层的输出是将所有id类特征对应的embedding向量concat到到一起输入到DNN中。

$z_L=\sigma(W_{L-1} z_{L-1}+b_{L-1})$ 表示上一层的输出作为下一层的输入
$y_{DNN}=\sigma(W^{L}a^L+b^L)$
输出使用sigmoid激活函数激活

代码实现
在这里插入图片描述

思考
1 如果对于FM采用随机梯度下降SGD训练模型参数，请写出模型各个参数的梯度和FM参数训练的复杂度
训练的复杂度为： o(bachsize * kn)

2 对于下图所示，根据你的理解Sparse Feature中的不同颜色节点分别表示什么意思
黄色节点代表该sparse feature中出现的值，而其他点则代表未在该样本中出现的值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DeepRecommendationModel task3

对于CTR问题，最有效的提升任务表现的策略是特征组合(Feature Interaction)其他方法的局限：DNN ：由于离散特征需要使用one-hot编码处理，会导致维度猛增，可以将OneHot特征转换为Dense Vector。通过增加全连接层可以实现高阶的特征组合，但是仍然缺少低阶的特征组合FNN 和PNN结合FM和DNN两种模型，得到FNN在FNN中加入一个product（做内积或外积）模块，得到PNNWide & DeepFNN和PNN仍然对于低阶组合特征学
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。