盒马生鲜是根据什么进行推荐的？——IDs Representation in E-commerce（阿里2018KDD）

ty44111144ty

于 2019-09-01 16:29:16 发布

阅读量2.1k

点赞数

分类专栏：算法机器学习 nlp 文章标签： word2vec id embedding KDD2018

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ty44111144ty/article/details/100184561

版权

本文介绍了阿里巴巴2018KDD论文中的ID表示方法在盒马生鲜推荐系统中的应用，包括item ID, 属性ID和user ID的embedding学习，以及如何解决item和user的冷启动问题。盒马利用item相似度进行推荐，并通过淘宝用户数据进行迁移学习，以应对新用户和新品的推荐挑战。" 79314107,7369662,图的深度/广度优先遍历解析,"['数据结构', '图论', '算法', '遍历']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文地址：盒马生鲜是根据什么进行推荐的？——IDs Representation in E-commerce（阿里2018KDD）

欢迎关注我的公众号，微信搜 algorithm_Tian 或者扫下面的二维码~

现在保持每周更新的频率，内容都是机器学习相关内容和读一些论文的笔记，欢迎一起讨论学习~

去年的时候介绍了很多embedding相关的方法和论文，这篇阿里在2018KDD的文章算是一个比较巧妙的对ID进行embedding的方法。

文章全称为：

Learning and Transferring IDs Representation in E-commerce

论文介绍的方法应用在了盒马生鲜app上，涉及推荐及解决冷启动问题。

本博文分以下几方面来介绍这篇论文：

背景知识（盒马的推荐系统、id之间的属性关系）
模型介绍（item id和属性id还有user id）
在盒马中的应用（item相似性推荐、item冷启动、不同平台user迁移学习、多任务）
总结

1. 背景知识

2. 模型介绍

2.1 item ID embedding

2.2 属性的id embedding

2.3 user id embedding

3. 盒马中的应用

3.1 基于item相似度的推荐

3.2 item的冷启动

3.3 user的冷启动

1. 背景知识

在线购物平台的数据里，有一些无序的离散特征，也就是ID，比如商品ID、商品的分类ID、用户ID、商户ID、品牌ID等等。不同的ID之间存在一定关系，所以把ID视作特征加入一些模型中是有一定意义的。但是传统的处理的id特征的方法存在两个问题：

（1）大部分ID是以one hot形式加入模型，高维稀疏

（2）不能反映ID之间的一些关系，无论是在同一空间（如品牌这一层次空间内部）还是不同空间（如品牌和商品这种不同空间）

于是作者就想到了NLP中，也是把离散的词语经过学习映射到低维的稠密空间中，并且在这个空间中，可以获取到这些词语语义上的关联。那么如果将这些离散的ID视作word2vec中的词语，构建一种输入形式，是不是就可以为每个ID学习出一个低维稠密向量？

于是文章提出了一种item2vec方法，以item id的embedding学习为基础，同时训练所有其他属性的embedding，最后再根据用户点击的item序列计算user id的embedding。

各类ID之间的关系如下图所示：

可以看到，一个user ID1，他可能点击了item ID1和item ID2，其中item ID1拥有属性product ID1、brand ID1、cate ID1和store ID1。

文章提出的方法会应用在盒马生鲜app中，盒马的页面如下所示，一般item其实就是具体的某个商品。

下面的介绍是文章中提到的盒马中的挑战和推荐流程，不太感兴趣的同学可以跳过不看，不影响模型方法的理解学习。

用户可以按照类别浏览商品或者在推荐列表中看到商品。在盒马的应用场景中，有几大挑战：

（1）盒马卖的是时令生鲜，所以商品更换很频繁，面临冷启

最低0.47元/天解锁文章

博客等级

码龄17年

17
原创

30
点赞

173
收藏

23
粉丝

关注

私信

热门文章

分类专栏

编辑器使用 1篇
检索
算法 16篇
机器学习 16篇
深度学习 8篇
nlp 8篇

展开全部收起

上一篇：: 多任务学习在CVR预估中的应用：Entire Space Multi-Task Model（ESMM，阿里，SIGIR2018）

下一篇：: Airbnb中的id & type embedding（KDD2018）

最新评论

二阶优化方法——牛顿法、拟牛顿法(BFGS、L-BFGS)
高性能服务器: 拟牛顿法是求解非线性优化问题最有效的方法之一，于20世纪50年代由美国Argonne国家实验室的物理学家W.C.Davidon所提出来。Davidon设计的这种算法在当时看来是非线性优化领域最具创造性的发明之一。不久R. Fletcher和M. J. D. Powell证实了这种新的算法远比其他方法快速和可靠，使得非线性优化这门学科在一夜之间突飞猛进。拟牛顿法的本质思想是改善牛顿法每次需要求解复杂的Hessian矩阵的逆矩阵的缺陷，它使用正定矩阵来近似Hessian矩阵的逆，从而简化了运算的复杂度。拟牛顿法和最速下降法一样只要求每一步迭代时知道目标函数的梯度。通过测量梯度的变化，构造一个目标函数的模型使之足以产生超线性收敛性。这类方法大大优于最速下降法，尤其对于困难的问题。
多任务学习模型详解：Multi-gate Mixture-of-Experts（MMoE ，Google，KDD2018）
yichudu: 沙发赞一个

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。