item2vec--word2vec在推荐领域的使用

一:绪论

在word2vec诞生以后,embedding的思想迅速从自然语言处理领域扩大到各个领域,推荐系统也不例外,既然word2vec可以对词序列中的词进行embedding,那么也可以对用户购买序列中的一个商品也应该存在相应的embedding方法,与 Word2Vec 对应,这种方法被称为 Item2Vec,代表论文是微软研究人员在 2016 年发表《Item2Vec: Neural Item Embedding for Collaborative Filtering》。论文把 Word2vec 的 Skip-gram with Negative Sampling (SGNS)的算法思路迁移到基于物品的协同过滤 (Item-Based CF) 上,以物品的共现性作为自然语言中的上下文关系,构建神经网络学习出物品在隐空间的向量表示。

二:item2vec训练样本的生成方式

在item2vec中,样本的生成方式有两种:
1,基于时序
认为item之间存在存在强时序关系,即前面的item对后面的item的产生有很大影响,那么我们就可以把一段时间内产生的item序列看成是一个句子,序列中的item看成是一个词,这样对item序列的训练过程就与word2vec训练过程无异了,可以直接参照word2vec的方法进行embedding训练。基于时序的示例比如视频网站的用户观看的视频序列,音乐网站用户听的歌曲序列。
2,基于集合
认为 item 之间存在非常弱的时序关系,或者因为某种原因,我们无法获得 item 的序列。那么这种情况只能放弃考虑 item 间的时空信息,转而使用 item 集合来取代序列。
通常我们把

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值