Reinforcement Learning based Recommender System using Biclustering Technique
原文链接: https://arxiv.org/pdf/1801.05532.pdf
“强化学习推荐,借助双聚类biclustering减少状态和动作空间优化效率和效果”
Abstract:
推荐系统致力于在海量的信息中为用户推荐其感兴趣的内容,由于信息的爆炸式增长,推荐系统的重要性日益凸显,也产生了很多有效果的方法:其中一个方法就是将推荐系统建模成MDP问题,但是由于离散的状态动作太多,我们提出一个基于强化学习的推荐系统,将推荐系统建模成棋盘格的游戏(gridworld),利用双聚类技术以减少动作状态空间。这种方法还可以有效解决冷启动问题。
Introduction
协同过滤(CF)是常用的推荐方法,但是有两个缺陷:
1、CF有两个维度:用户user和项目item,但是无论用基于用户的协同过滤(user-based)还是基于项目的协同过滤(item-based)都是只考虑两个维度中的一维,很难捕捉到两个维度同时产生的重要影响,并且数据矩阵通常高维且稀疏。——所以利用双聚类技术
2、CF是静态的,用户的反应不能实时加入到数据中。——所以利用MDP技术
双聚类:
可见文档: