WWW2018|FwFM加权域分解机在CTR预估中的应用

Field-weighted Factorization Machines for Click-Through RatePrediction in Display Advertisin...
摘要由CSDN通过智能技术生成

Field-weighted Factorization Machines for Click-Through Rate Prediction in Display Advertising

Junwei Pan, Jian Xu, Alfonso Lobos Ruiz, Wenliang Zhao, Shengjun Pan , Yu Sun, Quan Lu

Yahoo Research, TouchPal, UC Berkeley, LinkedIn, Ablibaba

http://cn.arxiv.org/pdf/1806.03514.pdf

点击率预估在在线展示广告中非常重要。其中的数据通常是多域类别型数据,每个特征是类别型特征,并且属于且只属于一个域。这种数据具有有一种有趣的特性,一个域中的特征通常跟其他域中的特征交互方式不同。

最近,域分解机(FFMs)对这些不同的交互方式可以精确的建模,进而使得FFMs取得的效果非常好。但是,FFMs中的参数个数跟特征数和域数的乘积同阶,这在实际生产系统中时不可接受的。

这篇文章提出域加权的分解机(FwFMs),对不同域中不同的特征交互建模时在耗内存方面更加高效。

实验结果表明,FwFMs利用相对FFMs 4%的参数即可取得相当的效果。如果利用跟FFMs同样的参数个数,可以在两个真实ctr数据集上分别提升0.92%和0.47%。

展示广告核心诉求为

多域类别数据示例如下表

特征交互的影响举例如下

通常,不同域之间的特征交互强度不同

这篇文章的主要贡献如下

lr用于ctr预估的问题描述及数学表示如下

fm及ffm的数学表示及区别如下


不同特征交互的强度可以利用互信息来衡量

对应的图示如下

颜色越深,表示域对的交互信息越强

作者们所提模型数学表示如下

几个模型的参数个数对比如下

fwfm有三种形式

数据集描述、分割及采样策略描述如下

下面是特征描述及预处理逻辑

数据集信息统计如下

tensorflow的实现结构图示如下

几个模型在两个数据集上的效果对比如下

ffm和fwfm具有相同参数时,效果对比如下

fwfm及其变种效果对比如下

不同的正则系数对模型效果影响如下

不同的学习率对模型效果影响如下

不同的嵌入层单元数对模型效果影响如下

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值