摘要:
计算广告的本质是寻找广告和用户的匹配.我们可以将该问题可以看作一个推荐问题,即为用户推荐符合其兴趣的广告.但是计算广告有一个天然的缺陷,即点击率低,在推荐算法中,尤其是协同过滤算法,是基于用户的评分数据的,由于广告的点击率低,即用户评分数据太稀疏,因此传统推荐算法在这种情况下效果很差.这种评分数据太稀疏的情形,在推荐系统中被称为冷启动问题.在计算广告中,解决这种冷启动问题通常有两种方法,一种是利用强化学习的方法,通常将该问题转化为multi-armed bandit问题,另一种是利用推荐系统中基于内容的推荐方法. 本文研究的内容正是计算广告中的冷启动问题,本文提出了两种方法,一种是在搜索广告的场景下,利用用户的历史搜索记录,将该问题转化为一个基于session的multi-armed bandit问题,在利用已有数据拟合得到的模型的基础上,加入了不确定因子,在explore和exploit之间达到平衡.另一种方法是利用哈希的方法在冷启动中为用户推荐,本文提出了两种哈希算法,一种是基于最大熵的哈希算法,在使哈希值体现用户偏好的同时,使哈希值的熵最大,这样能够在最终的推荐结果中,在准确率和召回率之间达到平衡;另一种是基于boosting的哈希方法,利用了boosting泛化能力强的特点,通过逐位求解哈希值,能够使在哈希位数大的时候,仍然能保持很强的泛化能力,有很好的推荐效果. 本文通过实验验证了本文方法的有效性,session bandit的方法要比直接使用模型预测的结果和不使用用户历史搜索记录得到的结果要好.基于哈希的方法既能在效率上大大超过传统的冷启动方法,能在推荐效果上超过一些以前的冷启动方法.
展开