RecSys 多模 - 广告CTR多模态特征表示

最新推荐文章于 2025-04-29 15:18:15 发布

GelaBute

最新推荐文章于 2025-04-29 15:18:15 发布

阅读量1k

点赞数 22

分类专栏： Recsys多模特征文章标签：深度学习推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41196438/article/details/141255992

版权

Recsys多模特征专栏收录该内容

2 篇文章

订阅专栏

Enhancing Taobao Display Advertising with Multimodal Representations: Challenges, Approaches and Insights
官方解读文档

1 动机

多模特征引入能为推荐系统引入一定的语义信息。多模特征接入一般分为两个阶段，面临不同难点：

预训练获得多模特征：符合业务目标的高质量多模特征
多模特征接入推荐模型：多模特征与ID类特征存在语义和使用上的鸿沟，直接拼接多模特征没用

2 Pretrain - Semantic-Aware Contrastive Learning

在电商场景, 用户的搜索-购买行为链通常表示出显著的语义相关性。因此，将搜索query与用用户购买item作为正样本对
在这里插入图片描述
in-batch负采样受限于batch-size，因此作者参考MoCo的动量更新方法, 设置了个更大的memory bank用于采样更多的负样本。同时，还设置了hard负样本（仅点击样本）

3 Intergration with Rec Model

直接将多模特征和ID特征拼接输入，增益有限。作者提出observation：

simplifying the usage of multimodal repre- sentations improves performances。简化多模特征的使用可以提升效果。直接使用拼接未能取得很好效果是因为与多模特征连接的参数(如MLP层)可能并没有被充分训练
ID-based and multimodal-based models have training epoch discrepancy。ID特征模型和多模特征模型的训练所需Epoch不同。为了防止过拟合，ID特征模型一般one epoch；但多模特征模型需要多轮训练

3.1 SimTier

将target item和行为序列items的多模特征计算cos相似度
将[-1.0, 1.0]分成预先定义的N桶，分桶统计个数，即得到target item与行为序列整体相似度描述

3.2 MAKE - Multimodal Knowledage Extractor

MAKE主要用来解耦ID特征和多模特征相关参数的训练，分为两步：

multi-epoch training，抽取有效多模特征知识：CTR任务，仅多模特征接入DIN，再经过4-layers MLP预估CTR
knowledge utilization，接入下游任务：将DIN的输出 $v_{MASK}$ ，浅层MLP的中间层输出, 以及 $\hat{v}$ 分别与ID模型拼接, 再联合训练

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。