CTR问题中的转化率平滑方法

问题描述

对任何转化率预测问题来说,利用某个样本的转化率预测其未来的转化率都是有一定意义的。但实际上,商品样品数量比较大,并非所有商品的展示率或者曝光率都足够多;甚至某些商品基本没有出现,而如果直接预测这些商品的未来转化率为零显得有些武断。类似的情况还有:①两个展示次数分别为10次、1次,转化次数分别为8次、1次的两个商品A、B,我们对A的转化的信心是否比B更低一些呢?②两个展示次数分别为10次、1次,转化次数分别为1次、0次的两个商品C、D,我们对D的转化的信心是否比C更低一些呢?
这里就需要对展示次数和转化次数进行平滑,使转化率的预测更符合常识。

平滑方法

①计算所有商品的平均转化率 rate
②对每一个样本,点击次数 += n_add, 转化次数+= n_add*rate
比如对下表所示的样本,平均转化率为0.32,这里取n_add = 1。
样本0、1平滑之前的CTR为0.8、1,而我们显然对样本0的信心更足一些,因为样本1受随机因素干扰的可能性更大,而样本0的展示次数较多的情况仍然有很高的转化率。平滑之后CTR为0.75、0.66,更符合常识。

样本4、5、6平滑之前的CTR都为0,但是展示次数相差较大,这样预测显然有失公允,平滑之后样本6的转化率预测值为0.16,甚至比样本3的预测值更高。样本3的展示次数较多,但实际转化率很低,样本6虽然没有转化的样本,但是仅展示过1次,这样预测相对平滑前还是可以接受的。

indexn_clickn_throughCTRn_click_smoothedn_through_smoothedCTR_new
01080.8118.3235290.756684
1111.021.3235290.661765
2510.261.3235290.220588
31010.1111.3235290.120321
4500.060.3235290.053922
5200.030.3235290.107843
6100.020.3235290.161765

这里的参数n_add的取值较为关键,可能需要根据实际的业务以及数据来判断。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值