点击率预估方法总结
前言:
最近一直在做帖子维度的CTR预估,尝试了好些方法,把一些经过和想法记录下来。
C 表示点击数,I 表示展示数,p 表示CTR
1. 普通方法
p = C / I
2. 贝叶斯平滑
p = C + α / (I + α + β )
3. 时间衰减
C =
3. 位置纠偏
C =
4. UCB方法
p =
5. Tompson采样
p =
注:
目前实验还在进行中,上面的公式我有空抽时间补上或者直接贴图。
感叹,数据清洗提升效果貌似比上面这些方法好多了,不过话说回来,干净的数据是基础啊