CTR预估模型的进化之路

最新推荐文章于 2024-07-07 21:36:32 发布

TonyZhou110229

最新推荐文章于 2024-07-07 21:36:32 发布

阅读量3.8k

点赞数 4

分类专栏： ctr预估模型文章标签： ctr预估点击率预测广告系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013074302/article/details/76419592

版权

本文对比了各大厂商的CTR预估模型，包括LR、GBDT、GBDT+LR、FM+DNN、MLR和FTRL_Proximal。LR擅长处理离散特征，但需人工特征组合；GBDT处理连续特征有效，但不擅长离散特征；GBDT+LR结合两者优点，但预测速度较慢；FM+DNN用深度学习处理海量离散特征，但2阶FM限制了特征交叉；MLR改进LR，用分片线性模式拟合非线性分类面；FTRL_Proximal支持在线训练，具备稀疏性，但依赖特征工程。

摘要由CSDN通过智能技术生成

作者：tongzhou

转载请注明出处：http://blog.csdn.net/u013074302/article/details/76419592

导语

笔者对各大厂商CTR预估模型的优缺点进行对比，并结合自身的使用和理解，梳理出一条CTR预估模型的发展脉络，希望帮助到有需要的同学。

0. 提纲

1. 背景

2. LR 海量高纬离散特征 (广点通精排)

3. GBDT 少量低纬连续特征 (Yahoo & Bing)

4. GBDT+LR (FaceBook)

5. FM+DNN (百度凤巢)

6. MLR (阿里妈妈)

7. FTRL_Proximal (Google)

1. 背景

众所周知，广告平台的最终目标是追求收益最大化，以 CPC 广告为例，平台收益既与 CPC 单价有关，又与预测 CTR 有关。在排序的时候，CPC 可以认为是一个确定的值，所以这里的关键是预测用户的点击率 pCTR。

( 指数项 w 是一个调节因子，用于平衡用户体验和收入。扶持力度用于调节各个广告渠道 )

互联网公司根据各自业务的特点，研发出了各种各样的 CTR 预估模型及其变种，本文尝试在众多流派和分支中梳理出一条 CTR 预估模型的发展脉络。

2. LR 海量高纬离散特征 (广点通精排)

LR（逻辑回归）[1]可以称之上是 CTR 预估模型的开山鼻祖，也是工业界使用最为广泛的 CTR 预估模型。LR 是广义线性模型，与传统线性模型相比，LR 使用了 Logit 变换将函数值映射到 0~1 区间，映射后的函数值就是 CTR 的预估值。

LR 利用了 Logistic 函数，函数形式为：

对于线性边界，边界形式如下：

Logistic 函数在有个很漂亮的"S"形，如下图所示：

构造 log 损失函数，用梯度下降法求最小值，得到参数向量θ：

2.1 正则化

为了防止过拟合，通常会在损失函数后面增加惩罚项 L1 正则或者 L2 正则：

L1 正则化是指权值向量 w 中各个元素的绝对值之和，通常表示为||w||1；
L2 正则化是指权值向量 w 中各个元素的平方和然后再求平方根，通常表示为||w||2。

最低0.47元/天解锁文章

关注

4
点赞
踩
18

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

TonyZhou110229 CSDN认证博客专家 CSDN认证企业博客

码龄11年

2: 原创

53万+: 周排名

90万+: 总排名

2万+: 访问

: 等级

190: 积分

23: 粉丝

19: 获赞

4: 评论

76: 收藏

私信

关注

热门文章

分类专栏

最新评论

CTR预估模型的进化之路
生命的激流: 刚成为推荐算法工程师，看博主这篇写的很好，点赞。 “ LR 静态特征这种模型，信息主要存储在模型中（相比 GBDT 动态特征，信息既存储在模型中又存储在动态特征里）” 这个应该怎么理解？我知道GBDT 的信息是存在模型中，什么叫又存储在动态特征里呢？
CTR预估模型的进化之路
生命的激流: 刚成为推荐算法工程师，看博主这篇写的很好，点赞。 “ LR 静态特征这种模型，信息主要存储在模型中（相比 GBDT 动态特征，信息既存储在模型中又存储在动态特征里）” 这个应该怎么理解？我知道GBDT 的信息是存在模型中，什么叫又存储在动态特征里呢？
深度学习解决NLP问题：语义相似度计算——DSSM
qq_26590743: CDSSM 的原始论文中说：W_c is the feature transformation matrix, as known as the convolution matrix。这里应该就是做了一个 embedding，并没有做传统的卷积操作吧？
CTR预估模型的进化之路
eeshaxia: 简单明了深入浅出图文并茂忍不住留言为作者点赞！

大家在看

最新文章

深度学习解决NLP问题：语义相似度计算——DSSM

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。