嘿,记得给“机器学习与推荐算法”添加星标
| 作者:朱勇椿
| 单位:中国科学院大学
| 研究方向:跨域推荐、多任务学习
如何给新加入的用户推荐可能感兴趣的物品?如何将新上架的物品推荐给潜在的用户?这两个问题分别是用户冷启动和物品冷启动,统称为冷启动推荐。冷启动问题是推荐系统中极具挑战的一个问题,也是一个业界学术界同时高度关注的问题,本期为大家分享一些冷启动推荐算法层面的思路。
冷启动推荐特指如何给新用户或者新物品进行推荐。“新”也就意味着交互数据少,因此很难抓获冷启动用户兴趣偏好,以及冷启动物品的特质。如何进行好的冷启动推荐,主要可以从以下几个方面着手:
高效地利用side information
高效地利用有限的交互数据
Explore & exploit
除了常见的用户和物品冷启动推荐以外,还有一些其他场景的冷启动问题,本文也会简单进行介绍。
一、高效地利用side information
我们把除了id信息以外的别的信息统称为side information,比如属性特征,用户性别、年龄特征,物品的类别、价格,额外的补充信息比如知识图谱,辅助领域等等。现有的推荐模型已经将用户、物品属性用到模型中,但是针对冷启动问题,这些辅助信息还可以有更加高效的使用方法。
1、高效利用属性特征
1.1 DropoutNet[1]
这篇文章改变了模型训练方式,在训练过程中加入dropout的机制,使得模型不过度依赖于ID embedding,而是其他内容特征。从而使得冷启动推荐主要是根据内容特征来进行推荐,减小了不好的ID embedding的影响。
1.2 MetaEmbedding[2]
冷启动推荐效果不佳,主要原因在于交互数量少,ID embedding学不好。那么为了更好地学习ID embedding,