阿里CTR预估三部曲(1):Deep Interest Network for Click-Through Rate Prediction简析

本文介绍了阿里提出的Deep Interest Network (DIN)在点击率预测中的应用,针对传统模型无法捕捉用户多样兴趣的问题,DIN通过注意力机制学习局部激活信息。文章详细阐述了DIN的特征表示、基础模型结构以及DIN的独特激活单元。此外,还讨论了训练技巧,包括Mini-batch Aware Regularization和Data Adaptive Activation Function(Dice激活函数)。实验结果表明,DIN在捕获用户兴趣和提高CTR预测准确性方面表现出色。
摘要由CSDN通过智能技术生成

阿里CTR预估三部曲(1):Deep Interest Network for Click-Through Rate Prediction

Introduction

CTR预估是工业应用中的重要任务,最近兴起的模型基本都是遵循embedding&MLP范式的。也就是将高维稀疏向量首先映射成低维的embedding向量并转换成固定长度的向量,最后将所得向量串联在一起经过MLP学习到特征间非线性关系后输出结果。但是这个很明显,对于不同的candidate来说,其所得表示向量是一致,导致无法捕捉到用户多样的兴趣。因此阿里提出了DIN。同时提出了一种新的激活函数Dice以及一个减少计算量的正则化函数。

DIN

Feature Representation

CTR预估的输入向量一般是高维稀疏向量。下面是一个列子:
在这里插入图片描述

都是所谓的one-hot或multi-hot的向量。

而整个输入空间则如图所示:

在这里插入图片描述

Base Model

base model 如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值