盒马生鲜是根据什么进行推荐的?——IDs Representation in E-commerce(阿里2018KDD)

原文地址:盒马生鲜是根据什么进行推荐的?——IDs Representation in E-commerce(阿里2018KDD)

欢迎关注我的公众号,微信搜 algorithm_Tian 或者扫下面的二维码~

现在保持每周更新的频率,内容都是机器学习相关内容和读一些论文的笔记,欢迎一起讨论学习~


去年的时候介绍了很多embedding相关的方法和论文,这篇阿里在2018KDD的文章算是一个比较巧妙的对ID进行embedding的方法。

文章全称为:

Learning and Transferring IDs Representation in E-commerce

论文介绍的方法应用在了盒马生鲜app上,涉及推荐解决冷启动问题。

本博文分以下几方面来介绍这篇论文:

  1. 背景知识(盒马的推荐系统、id之间的属性关系)

  2. 模型介绍(item id和属性id还有user id)

  3. 在盒马中的应用(item相似性推荐、item冷启动、不同平台user迁移学习、多任务)

  4. 总结

1. 背景知识

2. 模型介绍

2.1 item ID embedding

2.2 属性的id embedding

2.3 user id embedding

3. 盒马中的应用

3.1 基于item相似度的推荐

3.2 item的冷启动

3.3 user的冷启动

4. 总结


1. 背景知识

在线购物平台的数据里,有一些无序的离散特征,也就是ID,比如商品ID、商品的分类ID、用户ID、商户ID、品牌ID等等。不同的ID之间存在一定关系,所以把ID视作特征加入一些模型中是有一定意义的。但是传统的处理的id特征的方法存在两个问题:

(1)大部分ID是以one hot形式加入模型,高维稀疏

(2)不能反映ID之间的一些关系,无论是在同一空间(如品牌这一层次空间内部)还是不同空间(如品牌和商品这种不同空间)

于是作者就想到了NLP中,也是把离散的词语经过学习映射到低维的稠密空间中,并且在这个空间中,可以获取到这些词语语义上的关联。那么如果将这些离散的ID视作word2vec中的词语,构建一种输入形式,是不是就可以为每个ID学习出一个低维稠密向量

于是文章提出了一种item2vec方法,以item id的embedding学习为基础,同时训练所有其他属性的embedding,最后再根据用户点击的item序列计算user id的embedding。

各类ID之间的关系如下图所示:

可以看到,一个user ID1,他可能点击了item ID1和item ID2,其中item ID1拥有属性product ID1、brand ID1、cate ID1和store ID1。

文章提出的方法会应用在盒马生鲜app中,盒马的页面如下所示,一般item其实就是具体的某个商品。

下面的介绍是文章中提到的盒马中的挑战和推荐流程,不太感兴趣的同学可以跳过不看,不影响模型方法的理解学习。

用户可以按照类别浏览商品或者在推荐列表中看到商品。在盒马的应用场景中,有几大挑战:

(1)盒马卖的是时令生鲜,所以商品更换很频繁,面临冷启动问题

(2)盒马是一个新的app(应该是指2017、2018年的时候),用户的冷启动问题也很严重

(3)由于盒马主打新鲜,及时推荐很重要。他们的做法是预存用户和商品间的评分。

盒马具体做法分为以下四步:

  • 准备工作:线下计算user-to-trigger (u2t)和trigger-to-item(t2i)的分数并存储,在这里trigger可以灵活设置,可以是商店、品牌、种类、商品等属性。

  • 匹配:对每个访问用户,根据他的ID找到对应的trigger,然后根据这些trigger就可以找到一个item的候选集

  • 过滤:过滤掉一些重复item和下架或卖完了的item

  • 排序:综合各种权重(商业考虑和匹配分数以及其他因素)排序

接下来我们介绍这些id embedding怎么学习得到。


2. 模型介绍


2.1 item ID embedding

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值