简介
双塔模型(Dual Tower Model)是一种经典的推荐系统召回模型,由微软研究院于2013年提出。它利用深度学习技术将用户表示(User Embedding)和物品表示(Item Embedding)映射到同一语义空间中,并通过计算两者的相似度来衡量用户与物品之间的相关性。DSSM模型的优点是结构简单、易于实现,并且能够利用各种特征信息,因此在推荐系统中得到了广泛应用。
DSSM模型的详细原理
DSSM模型由两个独立的神经网络组成,分别称为用户塔(User Tower)和物品塔(Item Tower)。
其结构非常简单,如上图所示,左侧是用户塔,右侧是Item塔。在用户侧结构中,其输入为用户侧特征(用户画像信息、统计属性以及历史行为序列等);在用户侧结构中,其输入为Item相关特征(Item基本信息、属性信息等)。对于这两个塔本身,则是经典的DNN模型,在训练过程中,其输入由特征OneHot到特征Embedding,再经过几层DNN隐层,两个塔分别输出user embedding和item embedding,最后这两个embedding做内积或者Cosine相似度计算,使得user和item在embedding映射到共同维度的语义空间中。
DSSM模型的优缺点
优点
- 结构简单、易于实现
- 能够利用各种特征信息
- 模型可解释性强
缺点
- 对超参数敏感
- 训练数据需求量大
- 存在冷启动问题:对于新用户或新物品,由于缺乏历史数据而无法进行准确的推荐。
DSSM模型应用
DSSM模型可以应用于各种推荐系统场景,例如:
1. 商品推荐
在商品推荐场景中,DSSM模型可以用于将用户和商品表示为低维度的向量表示,并通过计算两者的相似度来衡量用户对商品的喜爱程度。具体来说,可以利用用户的历史购买记录、浏览记录、加入购物车记录等行为数据来构建用户表示,并利用商品的标题、描述、图片、价格等属性信息来构建商品表示。然后,通过计算用户表示和商品表示的相似度,可以为每个用户推荐其可能感兴趣的商品。
2. 新闻推荐
在新闻推荐场景中,DSSM模型可以用于将用户和新闻表示为低维度的向量表示,并通过计算两者的相似度来衡量用户对新闻的兴趣程度。具体来说,可以利用用户的历史阅读记录、点赞记录、评论记录等行为数据来构建用户表示,并利用新闻的标题、正文、作者、来源等信息来构建新闻表示。然后,通过计算用户表示和新闻表示的相似度,可以为每个用户推荐其可能感兴趣的新闻。
3. 音乐推荐
在音乐推荐场景中,DSSM模型可以用于将用户和音乐表示为低维度的向量表示,并通过计算两者的相似度来衡量用户对音乐的喜爱程度。具体来说,可以利用用户的历史播放记录、收藏记录、下载记录等行为数据来构建用户表示,并利用音乐的名称、歌手、专辑、风格等信息来构建音乐表示。然后,通过计算用户表示和音乐表示的相似度,可以为每个用户推荐其可能喜欢的音乐。
4. 广告推荐
在广告推荐场景中,DSSM模型可以用于将用户和广告表示为低维度的向量表示,并通过计算两者的相似度来衡量用户对广告的点击意愿。具体来说,可以利用用户的历史浏览记录、点击记录、购买记录等行为数据来构建用户表示,并利用广告的标题、描述、图片、落地页等信息来构建广告表示。然后,通过计算用户表示和广告表示的相似度,可以为每个用户推荐其可能感兴趣的广告。
5. 其他应用场景
除了上述常见的应用场景之外,DSSM模型还可以应用于其他推荐系统场景,例如:
- 电影推荐
- 书籍推荐
- 应用推荐
- 旅游推荐
总结
DSSM模型是一种简单有效且易于实现的双塔模型,在推荐系统中得到了广泛应用。随着深度学习技术的发展,DSSM模型也在不断地改进和完善,未来将发挥更大的作用。