《A survey on knowledge graph-based recommender systems》
摘要
- 推荐系统旨在为用户推荐个性化的在线商品信息,其广泛应用于web场景
- 处理因海量信息数据所导致的信息过载的问题,以提升用户体验
- 知识图谱可有效解决推荐系统中数据稀疏、冷启动、推荐多样性等问题
- 首先介绍推荐系统和知识图谱的一些概念
- 随后详细介绍现有方法如何挖掘知识图谱不同种类的信息并应用于推荐系统
- 此外总结了一系列推荐应用场景
- 最后提出了前景的看法,展望了未来的研究方向
关键词
知识图谱,推荐系统,协同过滤,异质信息网络,图嵌入
1 引言
- 核心目标:通过分析用户行为、兴趣、需求等信息,爱海量数据中挖掘用户感兴趣的信息。(如商品、新闻、POI和试题等)
- 个性化推荐算法是推荐系统的核心,主要分为三类:基于内容的推荐算法、基于协同过滤的推荐算法和混合推荐算法
- 协同过滤推荐算法利用用户历史的行为偏好数据构建模型,优势不需要对物品进行特征提取,存在问题包括洗漱问题和冷启动问题
- 研究者尝试景协同过滤推荐算法和其他辅助信息相结合搭建混合推荐系统
- 知识图谱是混合推荐系统中一类有效的辅助信息,是一种有向信息网络,拓展了隐藏的关联关系,补充了用户与物品交互数据
- 两类技术方法:基于嵌入的方法和基于路径的方法
- 针对推荐物品的领域和推荐任务对现有工作的应用场景
- 展望:构建动态的推荐系统和联合迁移学习下的推荐系统
2 研究背景
2.1 推荐系统
用户U和物品V量级非常大,但是观测的R却极其稀疏
- 基于内容的推荐算法
用户可能会喜欢与他曾经喜欢过的物品相似的物品
优点:解决新物品冷启动问题,不受R的稀疏性影响,推荐结果有不错的可解释性
缺点:构造物品属性特征复杂,缺乏多样性,新用户冷启动问题 - 基于协同过滤的推荐算法
目前应用最成功的算法
利用用户和物品历史的反馈数据,挖掘用户和物品本身的相关联性
1、基于用户的推荐
用户可能喜欢与他相似的用户喜欢的物品
优点:避开了对物品自身属性的特征挖掘
缺点:用户数量变化很大时算法效率低,新用户冷启动问题
2、基于物品的推荐
使用物历史被反馈数据来判断物品相似性
优点:计算简单
缺点:无法再不离线更新物品相似性时推荐新的物品给用户
3、基于模型的推荐
解决了数据稀疏和难以在大量数据集上返回即时结果的问题
通过历史数据利用机器学习方法训练得到预训练模型,从而实时预测任意用户对某一物品的偏好 - 混合推荐算法
混合方法包括简单的推荐结果加权融合、切换、混合,不同数据源的特征组合,复杂的多模型级联、特征递增和元层次混合
2.2 知识图谱
本质是一个存储知识实体与实体之间关系的结构化网络,可以帮助理解形式化描述、理解现实世界的事物及其相互关系
三元组形式:G=(E,R,S)
E表示所有种类实体的集合,R表示所有关系的集合,S表示所有三元组的集合
每一个三元组S都由 头实体,关系,尾实体 构成
动态知识图谱中 多了时间戳 用四元组
2.3 为什么应用知识图谱在推荐系统中
- 面临数据稀疏和冷启动问题
- 推荐系统中可解释性问题
3 基于知识图谱的推家系统:方法与应用
3.1 基于知识图谱的推荐算法分类
3.1.1 基于嵌入的方法
- 基于Trans系列的图谱嵌入方法
TransE、TransH、TransR、TransD - 基于异质信息网络的图嵌入方法
3.1.2 基于路径的方法
主要是挖掘基于图谱用户、物品之间多种连接关系
3.2 基于知识图谱的推荐应用分类
3.2.1 传统推荐系统
电影、图书、新闻、电商商品、POI(地图上非常有意义的点)、音乐、药物
3.2.2序列化推荐系统
目的在于捕捉用户兴趣的变化模式,从而基于用户历史的交互信息预测当前的兴趣点。
经典的建模方法:基于马尔科夫的模型,循环精神网络的模型(√)
3.2.3可解释推荐系统
目的推荐物品给用户的同时给出推荐的原因,从而提升推荐系统的可靠性
4 未来的研究
4.1 动态知识图谱
知识图谱之间的关系是具有时效性
4.2动态推荐系统
增量学习特点:
1、可以从新的数据中学习知识,更新模型
2、遗忘城粗来过的数据不必全部重新处理
3、学习新的数据知识时可以保留大部分原来的知识
4.3 基于迁移学习
主要是利用从源推荐系统学习到通用的模型系数,通过共享这部分模型,联合目标系统的私有模型参数共同训练,从而提神效果解决不足
可解决冷启动问题 提升可解释性