推荐系统遇上深度学习(三十六)--Learning and Transferring IDs Representation in E-commerce...

最新推荐文章于 2022-02-13 23:20:18 发布

文文学霸

最新推荐文章于 2022-02-13 23:20:18 发布

阅读量373

点赞数

本文链接：https://blog.csdn.net/abcdefg90876/article/details/90458934

版权

本文探讨了在电商推荐系统中如何利用深度学习处理ID类特征，提出了一种基于item2vec并考虑ID间结构连接的方法。通过Skip-gram、负采样、联合嵌入属性ID等技术，学习物品、用户和属性ID的向量表示，应用于物品相似度计算、新物品迁移、跨域推荐和任务迁移，改善了推荐效果。

摘要由CSDN通过智能技术生成

本文介绍的文章题目为《Learning and Transferring IDs Representation in E-commerce》，下载地址为：https://arxiv.org/abs/1712.08289

本文介绍了一种ID类特征的表示方法。该方法基于item2vec方式，同时考虑了不同ID类特征之间的连接结构，在盒马鲜生app上取得了不错的应用效果，我们来一探究竟。

1、背景

在推荐系统特别是电商领域的推荐中，ID类特征是至关重要的的特征。传统的处理方式一般是one-hot编码。但是这种处理方式存在两个主要的弊端：
1）高维稀疏问题：对于高维稀疏问题，若有N个物品，那么用户交互过的物品的可能情况共2^N种情况，为了使我们的模型更加具有可信度，所需要的样本数量是随着N的增加呈指数级增加的。
2）它无法反映ID之间的关系：对于同质信息来说，比如不同的物品，假设是iphon5和iphone6，以及iphone5和华为，在转换成one-hot编码后，距离是一样的，但是实际上，iphon5和iphone6的距离应该更近。对于异质信息，如物品ID和商铺ID，它们的距离甚至无法衡量，但实际上，一家卖苹果手机的商铺和苹果手机之间，距离应该更近。

对于上述问题，出现了word2vec以及item2vec的解决方案，将ID类特征转换为一个低维的embedding向量，这种方式在电商领域的推荐中取得了不错的效果。

本文提出的方式，基于item2vec，同时还考虑了不同ID类特征之间的连接结构，通过这些连接，在ItemID序列中的信息可以传播到其它类型的ID特征，并且可以同时学习这些ID特征的表示，框架如下图所示：

上面的学习方式在盒马app中有以下几方面的应用：
1）Measuring the similarity between items：建模物品之间的相似度
2）Transferring from seen items to unseen items：将已知物品的向量迁移到位置物品上
3）Transferring across different domains：将不同领域的向量进行迁移
4）Transferring across different tasks.：从不同的应用场景中进行迁移。

上面的几个应用我们在后文中会详细介绍。接下来，我们首先来介绍一下本文如何对ID类特征进行处理。