如何理解 热穿透现象

举个简单的例子,假设是一个极端简单的场景,系统里只有两种人,一种人叫南方人,一种人叫北方人。然后只有两条广告,一个A一个B。

南方人 对 广告A的ctr是10%,完全不点击B,并且有一百万条这样的样本;

北方人 对 广告B的ctr是1%,A ctr是0.5%,有一万条这样的样本;

那么不使用人群分类这个特征的时候,你的模型一定对所有人都推荐A,因为A用这个模型跑出来预估ctr应该接近10%,不论哪个人群。

我理解,这种现象就可以理解为热穿透现象。

使用人群分类以后,部分权重就会分配给人群,比如南方人这个特征会得到很高的权重,这样在广告id上的权重就会大大降低。这样会缓解热度穿透导致的部分人群行为特别倾斜影响广告整体预估分布的现象。

当然即使你做了这个,恐怕个性化能力还是不够的,你还是需要加上人群x广告id的组合才能起到真正的个性化效果。

另外思考一个问题,对于广告来说更加有意义。就是广告优化的不是ctr,而是广告收益。如果你的模型能预测出来南方人,他的点击率对于A和B分别是1%和0.9%,而北方人,他的点击率对于A和B分别是0.5%和0.1%。

A和B的出价分别是1块钱和2块钱一个点击。那么对于两种人的广告展现策略肯定是不同的。所以你的模型加入用户信息后能对实际的ctr预测的更准,尽管这个准不一定能立即体现在他的per User AUC上,但是却能够影响乘上出价后的调度结果,那么这个收益还是非常大的。

 

该例子来源于:https://www.zhihu.com/question/64788086 知乎:LR实现CTR预估加入用户特征的目的是什么?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值