广告冷启动_计算广告中冷启动问题的研究

摘要:

计算广告的本质是寻找广告和用户的匹配.我们可以将该问题可以看作一个推荐问题,即为用户推荐符合其兴趣的广告.但是计算广告有一个天然的缺陷,即点击率低,在推荐算法中,尤其是协同过滤算法,是基于用户的评分数据的,由于广告的点击率低,即用户评分数据太稀疏,因此传统推荐算法在这种情况下效果很差.这种评分数据太稀疏的情形,在推荐系统中被称为冷启动问题.在计算广告中,解决这种冷启动问题通常有两种方法,一种是利用强化学习的方法,通常将该问题转化为multi-armed bandit问题,另一种是利用推荐系统中基于内容的推荐方法. 本文研究的内容正是计算广告中的冷启动问题,本文提出了两种方法,一种是在搜索广告的场景下,利用用户的历史搜索记录,将该问题转化为一个基于session的multi-armed bandit问题,在利用已有数据拟合得到的模型的基础上,加入了不确定因子,在explore和exploit之间达到平衡.另一种方法是利用哈希的方法在冷启动中为用户推荐,本文提出了两种哈希算法,一种是基于最大熵的哈希算法,在使哈希值体现用户偏好的同时,使哈希值的熵最大,这样能够在最终的推荐结果中,在准确率和召回率之间达到平衡;另一种是基于boosting的哈希方法,利用了boosting泛化能力强的特点,通过逐位求解哈希值,能够使在哈希位数大的时候,仍然能保持很强的泛化能力,有很好的推荐效果. 本文通过实验验证了本文方法的有效性,session bandit的方法要比直接使用模型预测的结果和不使用用户历史搜索记录得到的结果要好.基于哈希的方法既能在效率上大大超过传统的冷启动方法,能在推荐效果上超过一些以前的冷启动方法.

展开

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
冷启动描述了在线广告平台普遍公认的挑战:由于数据有限,机器学习系统无法准确估计新广告的点击率 (CTR) 和转化率 (CVR),进而无法对这些新广告进行有效定价或与平台用户匹配。 新广告冷启动不成功会促使广告主离开平台,降低广告市场的厚度。 为了解决在线广告平台的冷启动问题,我们构建了一个数据驱动的优化模型,以捕捉短期收入和广告的长期市场厚度之间的基本权衡。 基于对偶理论和老虎机算法,我们开发了带有可证明后悔上限的 O(T^{2/3}K^{1/3}(logT)^{1/3) 的影子竞价学习 (SBL) 算法}d^{1/2}),其 K 是广告数量,d 是底层机器学习预言机用于预测 CTR 和 CVR 的有效维度。 此外,我们提出的算法可以在实践直接实现,对真实的在线广告系统进行最少的调整。 为了证明我们的冷启动算法的实用性,我们与一个大型在线视频共享平台合作,在线实现了该算法。 在这种情况下,传统的单边实验会导致估计有很大偏差。 因此,我们进行了一项新的双边随机现场实验,并设计了无偏估计来检查 SBL 算法的有效性。 我们的实验结果表明,所提出的算法可以使冷启动成功率大幅提高 61.62%,而短期收益仅降低 0.717%,从而使总目标值提高 0.147%。 我们的研究弥合了强盗算法理论与广告冷启动实践之间的差距,并突出了精心设计的冷启动算法对在线广告平台的重要价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值