论文阅读笔记---《基于知识图谱的推荐系统研究综述》

本文探讨了知识图谱在推荐系统中的应用,包括解决数据稀疏性、冷启动及提高推荐可解释性等问题。介绍了基于知识图谱的推荐算法分类,如基于嵌入和路径的方法,并讨论了不同类型的应用场景,最后展望了未来研究方向。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

  • 推荐系统旨在为用户推荐个性化的在线商品信息,其广泛应用于web场景
  • 处理因海量信息数据所导致的信息过载的问题,以提升用户体验
  • 知识图谱可有效解决推荐系统中数据稀疏、冷启动、推荐多样性等问题
  • 首先介绍推荐系统和知识图谱的一些概念
  • 随后详细介绍现有方法如何挖掘知识图谱不同种类的信息并应用于推荐系统
  • 此外总结了一系列推荐应用场景
  • 最后提出了前景的看法,展望了未来的研究方向

关键词

知识图谱,推荐系统,协同过滤,异质信息网络,图嵌入

1 引言

  • 核心目标:通过分析用户行为、兴趣、需求等信息,爱海量数据中挖掘用户感兴趣的信息。(如商品、新闻、POI和试题等)
  • 个性化推荐算法是推荐系统的核心,主要分为三类:基于内容的推荐算法、基于协同过滤的推荐算法和混合推荐算法
  • 协同过滤推荐算法利用用户历史的行为偏好数据构建模型,优势不需要对物品进行特征提取,存在问题包括洗漱问题和冷启动问题
  • 研究者尝试景协同过滤推荐算法和其他辅助信息相结合搭建混合推荐系统
  • 知识图谱是混合推荐系统中一类有效的辅助信息,是一种有向信息网络,拓展了隐藏的关联关系,补充了用户与物品交互数据
  • 两类技术方法:基于嵌入的方法和基于路径的方法
  • 针对推荐物品的领域和推荐任务对现有工作的应用场景
  • 展望:构建动态的推荐系统和联合迁移学习下的推荐系统

2 研究背景

2.1 推荐系统

用户U和物品V量级非常大,但是观测的R却极其稀疏

  • 基于内容的推荐算法
    用户可能会喜欢与他曾经喜欢过的物品相似的物品
    优点:解决新物品冷启动问题,不受R的稀疏性影响,推荐结果有不错的可解释性
    缺点:构造物品属性特征复杂,缺乏多样性,新用户冷启动问题
  • 基于协同过滤的推荐算法
    目前应用最成功的算法
    利用用户和物品历史的反馈数据,挖掘用户和物品本身的相关联性
    1、基于用户的推荐
    用户可能喜欢与他相似的用户喜欢的物品
    优点:避开了对物品自身属性的特征挖掘
    缺点:用户数量变化很大时算法效率低,新用户冷启动问题
    2、基于物品的推荐
    使用物历史被反馈数据来判断物品相似性
    优点:计算简单
    缺点:无法再不离线更新物品相似性时推荐新的物品给用户
    3、基于模型的推荐
    解决了数据稀疏和难以在大量数据集上返回即时结果的问题
    通过历史数据利用机器学习方法训练得到预训练模型,从而实时预测任意用户对某一物品的偏好
  • 混合推荐算法
    混合方法包括简单的推荐结果加权融合、切换、混合,不同数据源的特征组合,复杂的多模型级联、特征递增和元层次混合

2.2 知识图谱

本质是一个存储知识实体与实体之间关系的结构化网络,可以帮助理解形式化描述、理解现实世界的事物及其相互关系
三元组形式:G=(E,R,S)
E表示所有种类实体的集合,R表示所有关系的集合,S表示所有三元组的集合
每一个三元组S都由 头实体,关系,尾实体 构成
动态知识图谱中 多了时间戳 用四元组

2.3 为什么应用知识图谱在推荐系统中

  • 面临数据稀疏和冷启动问题
  • 推荐系统中可解释性问题

3 基于知识图谱的推家系统:方法与应用

3.1 基于知识图谱的推荐算法分类

3.1.1 基于嵌入的方法

  • 基于Trans系列的图谱嵌入方法
    TransE、TransH、TransR、TransD
  • 基于异质信息网络的图嵌入方法

3.1.2 基于路径的方法

主要是挖掘基于图谱用户、物品之间多种连接关系

3.2 基于知识图谱的推荐应用分类

3.2.1 传统推荐系统

电影、图书、新闻、电商商品、POI(地图上非常有意义的点)、音乐、药物

3.2.2序列化推荐系统

目的在于捕捉用户兴趣的变化模式,从而基于用户历史的交互信息预测当前的兴趣点。
经典的建模方法:基于马尔科夫的模型,循环精神网络的模型(√)

3.2.3可解释推荐系统

目的推荐物品给用户的同时给出推荐的原因,从而提升推荐系统的可靠性

4 未来的研究

4.1 动态知识图谱

知识图谱之间的关系是具有时效性

4.2动态推荐系统

增量学习特点:
1、可以从新的数据中学习知识,更新模型
2、遗忘城粗来过的数据不必全部重新处理
3、学习新的数据知识时可以保留大部分原来的知识

4.3 基于迁移学习

主要是利用从源推荐系统学习到通用的模型系数,通过共享这部分模型,联合目标系统的私有模型参数共同训练,从而提神效果解决不足
可解决冷启动问题 提升可解释性

5 结束语

### 关于知识图谱构建的研究论文 在探讨知识图谱构建(Knowledge Graph Construction, KGC)领域时,研究者们关注如何自动化地创建和维护大规模的知识库。这不仅涉及实体识别、关系抽取等自然语言处理技术的应用,还包括跨源数据集成以及质量评估等多个方面[^1]。 对于自动化的KGC过程而言,其核心挑战在于从非结构化或半结构化的信息资源中提取有用的事实,并将其转化为机器可读的形式存储起来以便后续查询利用。为了应对这些难题,《A Comprehensive Survey on Automatic Knowledge Graph Construction》一文中总结了一系列方法论和技术进展,涵盖了基于规则的方法到最新的深度学习驱动方案不等。 此外,在考虑特定应用场景下的优化策略时,《Dyadic Classification Trees via Structural Risk Minimization》提出了通过最小化结构性风险来改进分类树模型的设计思路,虽然该工作主要聚焦于二元分类问题,但其中所蕴含的理念同样适用于指导KGC过程中涉及到的数据挖掘环节[^2]。 值得注意的是,并不是所有的学术成果都会经过同行评议发表成为正式出版物;一些预印本服务器上的文档或是会议研讨会中的报告也可能包含了极具价值的观点与见解。因此,在追踪最新动态时不应当忽视这类渠道所提供的资料[^3]。 最后,随着近年来大模型的发展及其同传统KG技术之间的相互促进作用日益明显,“图模互补”的趋势正逐渐显现出来。《图模互补:知识图谱与大模型融合综述》这篇笔记整理了多篇重要文献的内容概要,能够帮助读者快速了解这一前沿交叉领域的现状和发展方向[^4]。 ```python import requests from bs4 import BeautifulSoup def fetch_kgc_papers(): url = 'https://scholar.google.com/scholar?q=Automatic+Knowledge+Graph+Construction' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') paper_titles = [] for item in soup.select('.gs_rt a'): title = item.get_text() link = item['href'] paper_titles.append((title, link)) return paper_titles[:5] papers = fetch_kgc_papers() for idx, (title, link) in enumerate(papers, start=1): print(f"{idx}. {title}\nLink: {link}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

KryHan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值