推荐系统遇上深度学习(三十六)--Learning and Transferring IDs Representation in E-commerce...

本文探讨了在电商推荐系统中如何利用深度学习处理ID类特征,提出了一种基于item2vec并考虑ID间结构连接的方法。通过Skip-gram、负采样、联合嵌入属性ID等技术,学习物品、用户和属性ID的向量表示,应用于物品相似度计算、新物品迁移、跨域推荐和任务迁移,改善了推荐效果。
摘要由CSDN通过智能技术生成

本文介绍的文章题目为《Learning and Transferring IDs Representation in E-commerce》,下载地址为:https://arxiv.org/abs/1712.08289

本文介绍了一种ID类特征的表示方法。该方法基于item2vec方式,同时考虑了不同ID类特征之间的连接结构,在盒马鲜生app上取得了不错的应用效果,我们来一探究竟。

1、背景

在推荐系统特别是电商领域的推荐中,ID类特征是至关重要的的特征。传统的处理方式一般是one-hot编码。但是这种处理方式存在两个主要的弊端:
1)高维稀疏问题:对于高维稀疏问题,若有N个物品,那么用户交互过的物品的可能情况共2^N种情况,为了使我们的模型更加具有可信度,所需要的样本数量是随着N的增加呈指数级增加的。
2)它无法反映ID之间的关系:对于同质信息来说,比如不同的物品,假设是iphon5和iphone6,以及iphone5和华为,在转换成one-hot编码后,距离是一样的,但是实际上,iphon5和iphone6的距离应该更近。对于异质信息,如物品ID和商铺ID,它们的距离甚至无法衡量,但实际上,一家卖苹果手机的商铺和苹果手机之间,距离应该更近。

对于上述问题,出现了word2vec以及item2vec的解决方案,将ID类特征转换为一个低维的embedding向量,这种方式在电商领域的推荐中取得了不错的效果。

本文提出的方式,基于item2vec,同时还考虑了不同ID类特征之间的连接结构,通过这些连接,在ItemID序列中的信息可以传播到其它类型的ID特征,并且可以同时学习这些ID特征的表示,框架如下图所示:

4155986-a339b2661aeb9eee.png

上面的学习方式在盒马app中有以下几方面的应用:
1)Measuring the similarity between items:建模物品之间的相似度
2)Transferring from seen items to unseen items:将已知物品的向量迁移到位置物品上
3)Transferring across different domains:将不同领域的向量进行迁移
4)Transferring across different tasks.:从不同的应用场景中进行迁移。

上面的几个应用我们在后文中会详细介绍。接下来,我们首先来介绍一下本文如何对ID类特征进行处理。

2、学习ID的表征方式

2.1 Skip-gram on User’s Interactive Sequences

在电商领域,我们可以通过用户的隐式反馈,整理得到用户的一个交互序列。如果把每一个交互序列认为是一篇文档,那么我们可以通过Skip-Gram的方法来学习每一个item的向量。Skip-Gram的方法是最大化下面的对数概率:

4155986-0d25ba23d89178b4.png

其中,C是我们的上下文长度,假设长度是2,那么下图中梨的上下文就是前后的两个item:

4155986-529b519cff603908.png

有关Skip-Gram模型的相关知识,可以参考:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值