推荐算法炼丹笔记:CTR点击率预估系列入门手册

本文深入介绍了CTR点击率预估的系列模型,包括FiBiNET、DSIN、DIEN、DIN等,探讨了各模型的背景、创新点和效果。FiBiNET结合特征重要性和双线性交互,DSIN利用用户时序行为兴趣变化,DIEN通过双层GRU刻画兴趣进化,DIN采用Attention机制捕捉多兴趣场景。文章适合推荐系统和广告点击预测领域的研究者阅读。
摘要由CSDN通过智能技术生成

​CTR点击率预估系列家谱

v2-8941716e26f4f6a5efe4e89404635695_b.jpg

炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰。

(一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估

v2-154126bc9b8988aa1c66f45233f3feca_b.jpg

1.1 背景

本文发表在RecSys 2019,主要通过动态学习不同特征的特征重要性权重,解决CTR预估中对不同场景下不同特征的权重(ReWeight)重定义问题,同时,双线性的使用解决稀疏数据在特征交叉建模时的有效性问题。

1.2 创新

由模型结构图我们可以发现,本文核心结构主要有两个,Embedding Layer中的SENET LayerBilinear-Interaction Layer。(1)其中 SENET Layer又包含3个步骤,分别是

    • 对每个Field用Max Pool或者Mean Pool 操作的Squeeze Step;
    • 对每个Field用两层FC层计算特征重要性权重的Excitation;
    • 对原始每个Field利用Excitation得到的特征重要性权重重新赋权的ReWeight。

(2)而 Bilinear-Interaction Layer 层提出一种结合Inner Product和Hadamard Product方式,并引入额外参数矩阵W,学习特征交叉。主要通过3种方式得到交叉向量,分别是

  • 1)Field-All Type:所有特征组交叉时共享额外参数矩阵W;
  • 2)Field-Each Type:每个特征组Field-i 维护一个参数矩阵W-i;
  • 3)Filed-Interaction Type:每对交互特征P(i,j)都有一个参数矩阵W(i,j)。最后,Bilinear-Interaction Layer 将原始的特征Embedding向量 和 SENET层输出的Embedding向量分别得到交叉向量p和q。

1.3 效果

v2-350ea082de6a2e542691d4e48cd156b4_b.jpg

(二)DSIN:利用用户时序行为中兴趣变化进行CTR预估

v2-9431828769932b26b0cd3c90a01fccd0_b.jpg

2.0 前言

在读本文之前,我们需要先搞清楚两个概念,Sequence和Sessions。基于用户行为Behavior Sequence进行兴趣特征挖掘的方式目前被用于绝大数的CTR任务中。Sequence和Sessions的相同点在于它们都是由Behaviors组成的,但不同的是Sessions是根据一定的规则将用户的历史点击行为Behavior 进行划分得到的,也就是说,通过用户的点击时间对Sequence进行划分后,可以得到多个Sessions。

2.1 背景

本文发表在IJCAI 2019,主要通过将用户的历史点击行为划分为不同session,然后利用Transformer对每个Session进行学习得到兴趣向量后,使用BiLSTM学习用户在多个Session之间的兴趣变化,从而更好地完成CTR预估。

2.2 创新

由模型结构图我们可以发现,本文核心结构主要有4个。

1)Session Division Layer完成对用户历史点击行为的划分,以30分钟为划分依据,得到多个Sessions;


2)Session Interest Extractor Layer使用Bias Encoding 方式表征不同Session间的顺序,同时考虑到用户兴趣可能来自不同因素,利用 multi-head self-attention对每个session 建模得到兴趣向量表征;

3)Session Interest Interacting Layer在得到用户的兴趣向量表征之后,利用Bi-LSTM学习不同Session之间的由顺序带来的兴趣变化;

4)Session Interest Activating Layer利用注意力机制学习不同Session和Item之间的相关性,混合上下文信息的兴趣信息之后,对距离Item较近的Session赋予更大的权重。

2.3 效果

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值