《session-based recommendations with recurrent neural networks》ICLR 2016 阅读笔记

最新推荐文章于 2022-12-21 21:55:04 发布

StudyLess

最新推荐文章于 2022-12-21 21:55:04 发布

阅读量2.8k

点赞数 2

分类专栏：推荐算法文章标签：推荐-RNN-GRU

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/studyless/article/details/60152190

版权

推荐算法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章简介: 该文提出了利用RNN建模一个session间用户的点击序列。该方法完全利用用户在当前session里的反馈去做推荐，相比原依赖用户历史记录的推荐能在解决冷启动问题上更为简洁有效。

模型

文中提出的模型如下图所示:
Input层是对所有item做的one-hot encoding, 接下来是一层embedding层，再往下是一层或多层RNN模型，再往下是一个feedforward层，然后接到output，是一个维数等于item数量的向量，其中各元素为各item的打分。

这里写图片描述

文中选用的loss function有两种：
一种是BPR: Bayesian Personalized Ranking, 是一种pairwise ranking loss.

L s = - 1 N S \sum j = 1 N s l o g (σ (r^s, i - r^s, j))

$L_s = -\dfrac{1}{N_S} \sum^{N_s}_{j=1}log(\sigma(\hat{r}_{s,i}-\hat{r}_{s,j}))$

其中 $N_S$ 是采样规模， $\hat{r_{s,k}}$ 是当前时刻在item $k$ 上的打分， $i$ 是期望item，即在当前session下一时刻的目标item，而 $j$ 是负样本。

另一种是TOP1: 这是作者自改进的一个ranking loss。基于一个概念：relative rank of an item，在此作者定义两item的相对rank差为 $I(\hat{r}_{s,j}>\hat{r}_{s,i})$ , 该函数随两item间分值差距的增加而增大。作者使用sigmoid函数来近似 $I\{.\}$ 。最终的loss function如下所式，增加了对负样本的一个正则项，目的是使负样本的分值尽可能接近0，以防止正负样本间多重反馈导致大家分值集体偏高的情形。

L s = - 1 N S \sum j = 1 N s σ (r^s, i - r^s, j) + σ (r^2 s, j)

$L_s = -\dfrac{1}{N_S} \sum^{N_s}_{j=1}\sigma(\hat{r}_{s,i}-\hat{r}_{s,j}) + \sigma(\hat{r}^2_{s,j})$

优化*
session-parallel mini-batches: 在使用该模型的过程中，由于session长短变化大，也不宜对session做截断，因此文中在做mini-batch训练过程中做了一定的调整，使得每个batch都尽可能满。具体做法为：首先，在构建mini-batch的过程中，在一个session完结后，将另一个session拼接在该session之后，按此思想去确定input和output；其次，上次做法会带来的问题是，对于每处理到一个新的session，模型的隐层状态需要重置。

这里写图片描述

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
《session-based recommendations with recurrent neural networks》ICLR 2016 阅读笔记

文章简介: 该文提出了利用RNN建模一个session间用户的点击序列。该方法完全利用用户在当前session里的反馈去做推荐，相比原依赖用户历史记录的推荐能在解决冷启动问题上更为简洁有效。模型文中提出的模型如下图所示: Input层是对所有item做的one-hot encoding, 接下来是一层embedding层，再往下是一层或多层RNN模型，再往下是一个feedforward层，然
复制链接

扫一扫

专栏目录

博客等级

码龄8年

7
原创

10
点赞

24
收藏

17
粉丝

关注

私信

热门文章

分类专栏

最新评论

《Improved Recurrent Neural Networks for Session-based Recommendations》 DLRS 2016 阅读笔记
weixin_42014256: privileged information可译为内部信息，privileged有权限的，同义词有inside，结合文章应该认为是外部观测不到的数据？
《AutoRec: Autoencoders Meet Collaborative Filtering》WWW2015 阅读笔记
Zero-place: 帅哥，这句话什么意思？"未观测到的missing value在初始时赋一个默认值，比如1-5分的打分体系里统一给3" 是不是下面这段代码，到底有什么意义呀？ [code=python] for user in unseen_user_test_list: for item in unseen_item_test_list: if test_mask_r[user,item] == 1:#如果在测试集中存在这条评分记录，则进行记录decoder[user,item]=3 decoder[user,item] = 3 [/code]
《Improved Recurrent Neural Networks for Session-based Recommendations》 DLRS 2016 阅读笔记
刘大梦y: 麻烦问下博主，为什么认为output为embedding很有意义呢？如果label样本的embedding不准确，会有很大问题吧？
《AutoRec: Autoencoders Meet Collaborative Filtering》WWW2015 阅读笔记
靳晓帅: 博主有没有尝试复现论文呢？我用tensorflow搭建的AE，movielens做数据，发现并跑不出论文中的效果。。。
《AutoRec: Autoencoders Meet Collaborative Filtering》WWW2015 阅读笔记
胖儿里咯噔回复 StudyLess: 噢噢噢，明白了，我的思想还停留在KDD的那篇文章里，这里原来是提出了两种AutoRec方法，本质上都是只用了DL的方法去做推荐。这和CF+DL的思路还不是同一套:-P

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。