SIGIR 2021 | PCF-GNN：基于预训练图神经网络的显式交叉语义建模方案

阿里妈妈技术

于 2021-05-28 15:38:10 发布

阅读量1.1k

点赞数

文章标签： ctr 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alimama_Tech/article/details/117364778

版权

本文介绍了PCF-GNN，一种基于预训练图神经网络的显式交叉语义建模方案，用于解决CTR预测中的特征交互问题。通过预训练任务，模型可以推断未出现的交叉特征，并减少存储开销。实验显示，PCF-GNN在泛化性能和存储效率上优于传统方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

欢迎关注：阿里妈妈技术公众号本文作者：言乐阿里妈妈技术团队

Explicit Semantic Cross Feature Learning via Pre-trained Graph Neural Networks for CTR Prediction. SIGIR 2021

论文下载：https://arxiv.org/pdf/2105.07752.pdf

▐ 1. 背景

在CTR预估场景中，建模特征之间的交互关系是提升模型预估能力的关键之一。比如，在淘宝场景中，一个职业为篮球运动员的用户可能经常点击“Nike-Air Jordan”相关的商品；而一位职业为程序员的用户可能更喜欢点击数码产品。这些例子表明，职业和商品这两个特征之间的交互，即<职业，商品>，可以作为一个比较强的信号来帮助CTR的预估。

目前针对交叉特征的建模，主要分为两大类方法：隐式语义建模和显式语义建模。

隐式语义建模：其核心思想是设计一种交叉网络结构，希望通过网络结构自身的表达能力来学习特征之间的交互信息(比如Wide&Deep[1]，DeepFM[2],DCN[3]等等)。尽管，这类方法在工业界以及学术界都被证明能够取得不错的效果。然而其学习得到的交叉语义往往是隐式的，我们很难保证学习到的语义信息是我们想要的。
显式语义建模：常用的一种建模方式是利用交叉统计特征来进行显式语义的刻画。具体而言，交叉统计特征可以被看作是特征间历史交互次数的统计。比如，我们可以统计历史中所有职业是篮球运动员的用户点击商品“Nike-Air Jordan”的点击率，将这个统计的点击率作为对应样本在<职业，商品>上的交叉统计特征。显然，这样一种交叉统计值能够显式的反应出特征之间的交互关系，即值越大对应特征之间的相关性越高。

现有的大多数方法主要聚焦在隐式语义建模，而极少关注于显式语义建模。其往往简单的采用交叉统计特征来补充交叉特征的显式语义部分。然而直接利用交叉统计特征存在着两大挑战：

泛化性能差：交叉统计特征主要是依赖于历史的统计，因此是无法推断历史中从未出现过的交叉特征pair对的统计值。
存储开销大：在线服务的时候，针对交叉统计特征，我们往往需要维护一张<交叉特征，统计值>的映射表，比如<<篮球运动员，“Nike-

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。