WWW2018|FwFM加权域分解机在CTR预估中的应用

最新推荐文章于 2023-06-14 16:18:53 发布

frank_hetest

最新推荐文章于 2023-06-14 16:18:53 发布

阅读量1.6k

点赞数

文章标签：机器学习深度学习 python 神经网络算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hestendelin/article/details/109733613

版权

Field-weighted Factorization Machines for Click-Through RatePrediction in Display Advertisin...

摘要由CSDN通过智能技术生成

Field-weighted Factorization Machines for Click-Through Rate Prediction in Display Advertising

Junwei Pan, Jian Xu, Alfonso Lobos Ruiz, Wenliang Zhao, Shengjun Pan , Yu Sun, Quan Lu

Yahoo Research, TouchPal, UC Berkeley, LinkedIn, Ablibaba

http://cn.arxiv.org/pdf/1806.03514.pdf

点击率预估在在线展示广告中非常重要。其中的数据通常是多域类别型数据，每个特征是类别型特征，并且属于且只属于一个域。这种数据具有有一种有趣的特性，一个域中的特征通常跟其他域中的特征交互方式不同。

最近，域分解机(FFMs)对这些不同的交互方式可以精确的建模，进而使得FFMs取得的效果非常好。但是，FFMs中的参数个数跟特征数和域数的乘积同阶，这在实际生产系统中时不可接受的。

这篇文章提出域加权的分解机(FwFMs)，对不同域中不同的特征交互建模时在耗内存方面更加高效。

实验结果表明，FwFMs利用相对FFMs 4%的参数即可取得相当的效果。如果利用跟FFMs同样的参数个数，可以在两个真实ctr数据集上分别提升0.92%和0.47%。

展示广告核心诉求为

多域类别数据示例如下表

特征交互的影响举例如下

通常，不同域之间的特征交互强度不同

这篇文章的主要贡献如下

lr用于ctr预估的问题描述及数学表示如下

fm及ffm的数学表示及区别如下

不同特征交互的强度可以利用互信息来衡量

对应的图示如下

颜色越深，表示域对的交互信息越强

作者们所提模型数学表示如下

几个模型的参数个数对比如下

fwfm有三种形式

数据集描述、分割及采样策略描述如下

下面是特征描述及预处理逻辑

数据集信息统计如下

tensorflow的实现结构图示如下

几个模型在两个数据集上的效果对比如下

ffm和fwfm具有相同参数时，效果对比如下

fwfm及其变种效果对比如下

不同的正则系数对模型效果影响如下

不同的学习率对模型效果影响如下

不同的嵌入层单元数对模型效果影响如下

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
WWW2018|FwFM加权域分解机在CTR预估中的应用

Field-weighted Factorization Machines for Click-Through RatePrediction in Display Advertisin...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。