KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)

深度兴趣网络(DIN)是一种用于点击率预估的模型,旨在解决固定长度用户表示向量的瓶颈问题。DIN通过局部激活单元自适应地学习用户对特定广告的兴趣,提高了模型的表达能力。文章介绍了DIN的网络结构、激活函数优化以及在大规模数据集上的实验结果,证明了其在CTR预估任务中的优越性能。
摘要由CSDN通过智能技术生成

Deep Interest Network for Click-Through Rate Prediction

Guorui Zhou, Chengru Song, Xiaoqiang Zhu Ying Fan, Han Zhu, Xiao Ma, Yanghui Yan, Junqi Jin, Han Li, Kun Gai

Alibaba Group

KDD 2018

https://arxiv.org/pdf/1706.06978.pdf

点击率预估在工业界应用(比如在线广告)中是一项非常重要的任务。最近,研究人员提出了若干基于深度学习的模型,这些模型基本都遵循了嵌入+MLP这种范式。这些方法的流程基本都是首先将大规模稀疏输入特征映射到低维嵌入向量,然后以分组方式转换为固定长度的矢量,最后将这些特征串联在一起,传入多层感知器 (MLP) 中,进而学习特征之间的非线性关系。

如此一来,无论候选广告是什么,用户特征都被压缩成固定长度的表示向量。使用固定长度的向量是一个瓶颈,这给嵌入&MLP方法从丰富的历史行为中有效地捕捉用户的多种兴趣带来困难。本文提出了一种新的模型:深度兴趣网络(DIN),通过一个局部激活单元来自适应地从用户的历史行为中学习该用户对某一广告的兴趣,并得到一种表示向量,进而解决了上述难题。

该表示向量因广告不同而不同,这就大大提高了模型的表达能力。此外,作者们还提出了两种技巧:微型批量感知正则化和数据自适应激活函数,这两种技巧有助于训练具有数亿个参数的工业界深度网络。

作者们在两个公共数据集以及包含超过 20 亿个样本的阿里巴巴真实生产数据集上的进行了实验,结果表明了本文方法的有效性,与最先进的方法相比,该方法的性能更优。DIN现已成功部署在阿里巴巴的在线展示广告系统中。

DIN的主要特性在于局部激活单元以及加权sum pooling

现有方法存在一些缺陷,比如SGD只对当前mini-batch的稀疏特征进行更新;传统的l2正则计算量太大等

本文主要贡献如下


现有方法有些缺陷,比如都映射到固定长度的表示向量

DIN的思想借鉴了DeepIntent,采用了局部激活单元,加权sum pooling等技巧。

阿里的广告展示系统图示如下

其中主要包含两部分

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值