想象一种人工智能系统,能够像人类专家一样,通过无缝地连接多个文档中的信息来回答复杂问题。
由于检索增强生成(RAG)系统的进展,这一愿景正在迅速变为现实。
然而,目前的RAG方法在处理需要多步推理的微妙查询时仍然存在困难。
出现了一个有前途的解决方案:超关系图。
通过实现更丰富、更具上下文的知识表示,这些先进的图结构正在解锁问答任务中的新性能水平。
本文探讨了超关系图如何革新RAG系统,为更智能的人工智能铺平道路。
检索增强生成已成为现代问答系统的基石。通过结合大型语言模型(LLM)的广泛知识和检索并纳入外部信息的能力,RAG方法旨在产生更准确、更及时的响应。然而,随着查询变得越来越复杂,传统的RAG系统常常力不从心。它们难以有效地表示不同信息片段之间微妙的关系,导致检索无关且推理有误。
超关系图应运而生。这些先进的知识结构超越简单的主谓宾三元组,捕捉丰富的上下文信息。
人工智能的超级关系
通过这样做,它们解决了当前RAG系统的许多关键局限性。
本文认为,超关联图通过实现更具情境、微妙和高效的信息检索和推理,显著提高了RAG的性能。
我们将探讨这些图如何改进情境表示、查询相关性和多跳推理能力 — 最终将导致更智能和有能力的GenAI系统。
增强的上下文表征
超关系图的核心力量在于捕捉和表达丰富的上下文信息。与传统知识图不同,传统知识图谱仅限于简单的三元组(例如,“巴黎 - 是 - 法国首都”),超关系图可以将附加的元数据与每个事实关联起来。这些上下文信息可能包括:
-
源文档:追踪每条信息的来源
-
时间限定词:指示特定事实的真实时间
-
置信分数:反映提取信息的可靠性
这种增强表示为RAG系统提供了几个关键优势:
改进消歧
超关系图最显著的优势之一是其消除实体和关系歧义的能力。考虑一个关于苹果公司产品发布的查询。在传统知识图中,“苹果”一词可能是模棱两可的 - 可能指的是科技公司或水果。然而,超关系图可以利用上下文信息区分这些用法。
例如,与苹果公司产品发布相关的事实可能与元数据相关联,指示其来自技术新闻来源。这种额外的上下文允许RAG系统自信地解释此时“苹果”指的是该公司。类似地,时间限定词可帮助区分有关公司产品的历史和当前信息。
处理复杂查询
超关系图的丰富上下文表示对于回答复杂的多部分查询尤为有价值。考虑一个问题:“苹果最近产品发布的市场反应如何,与五年前的发布相比?”
回答这个查询需要综合跨越多个时间段和领域(产品信息、财务数据等)的信息。超关系图可以有效地表示这些相互关联的信息片段:
-
与特定日期相关联的产品发布事件
-
与时间限定词相关联的股价数据
-
与产品发布和市场反应相关联的新闻文章和分析报告
通过以结构化而灵活的格式捕获这些关系,超关系图使RAG系统能够更轻松地浏览复杂信息空间,以回答此类查询。
传统知识图谱的对比
要充分理解超关系图的价值,将它们直接与传统知识图谱方法进行比较会很有帮助:表现力:传统知识图谱受限于二元关系,而超关系图可以表示n元关系和附加属性。这使得知识表达更加细致和准确。
-
来源追踪:超关系图可以轻松保留有关每个事实来源的信息。这对于评估可靠性和解决冲突信息至关重要,这些能力在传统知识图谱中要困难得多。
-
时间推理:尽管一些传统知识图谱已经尝试整合时间信息,但它通常感觉附加而非结构的一部分。超关系图将时间推理作为知识表达的核心部分。
-
置信度和不确定性:超关系图谱可以通过将置信度分数或概率分布与实例相关联来自然地表示不确定性和冲突信息。这种细致入微的方法在传统知识图结构中实现起来很有挑战性。
提供的研究中描述的HOLMES系统实践中展示了这些优势。通过利用超关系图结构,HOLMES在多跳问题回答任务上实现了显著的性能提升,相比使用传统知识表示系统 [1]。
改善查询相关性与效率
超关系图除了增强知识表示之外,还能在RAG系统内实现更有针对性和高效的信息检索。这种改进体现在两个关键领域:增加了查询相关性和减少了计算开销。
更有针对性的信息检索
超关系图的丰富结构允许在查询和相关信息之间实现更精确的匹配。传统RAG系统常常依赖关键词匹配或嵌入相似性来检索潜在相关段落。虽然这种方法对于简单查询是有效的,但对于更复杂、多跳问题可能会遇到困难。
与之相反,超关系图允许系统以更接近人类推理方式的方式遍历实体之间的关系。例如,考虑一个类似于“2008年金融危机对欧洲可再生能源投资产生了什么影响?”的查询。
超关系图可以通过以下方式引导检索过程:
-
识别关键实体:“2008年金融危机”,“可再生能源”,“欧洲”
-
遍历相关关系:金融事件->经济影响->行业部门->地理区域
-
利用时间信息聚焦于适当的时间段
这种结构化方法导致更相关的检索结果,减少噪音并提高提供给语言模型生成的信息质量。
修剪过程
超关联图提供的最重要的效率提高之一来自它们支持智能修剪无关信息的能力。HOLMES 系统有效地展示了这一过程:
-
查询对齐知识架构:系统根据特定查询构建架构,识别可能相关的实体和关系类型。
-
辅助图架构:这与从一个大量领域内问题派生出的预先计算的架构相结合,捕捉所需信息类型的常见模式。
-
相关性评分:根据它们与组合架构的对齐对图元素进行评分。
-
修剪:只保留最高评分的元素,创建一个与查询高度相关的聚焦子图。这种修剪过程显著减少了语言模型在最终生成步骤中需要处理的信息量。在 HOLMES 实验中,与其他最先进方法相比,这导致输入令牌减少了高达 67%。
性能提升
超关系图带来的效率收益直接转化为基准数据集上的性能改善。在 HotpotQA 数据集上,这是一个广泛使用的多跳问题回答基准测试,HOLMES 取得了:
-
准确匹配(EM)分数为0.66(比以往最先进水平提高了20%)
-
F1分数为0.78
在关注需要 2-4 次推理的问题的 MuSiQue 数据集上也看到了类似的改进。
- 相较于先前最佳方法,EM得分增加了26%
这些数量上的改进得到人类评估的支持,在答案质量方面,HOLMES相比基准方法获得了更高的评分[1]。
输入令牌数量的显著减少,结合回答质量的提升,展示了超关联图增强RAG系统效率和有效性的力量。
提升多跳推理能力
也许超关系图最令人兴奋的潜力在于它们支持高级的多跳推理能力。这种能力对于回答需要综合来自多个来源的信息或遵循逻辑链条的复杂问题至关重要。
支持多步推理
超关系图提供了一个结构,自然地与多步推理过程相一致。考虑一下人类专家可能如何解决一个复杂问题:
-
确定关键实体和概念
-
回想起关于这些实体的相关事实
-
跟随事实之间的逻辑连接
-
综合信息以形成结论
超关系图使RAG系统能够比以往更密切地模拟这一过程。该图结构使系统能够:
-
从查询中获取种子实体开始
-
遍历相关关系以发现连接信息
-
利用上下文元数据评估每条信息的相关性和可靠性
-
通过遵循图中的路径构建推理链
这种结构化方法对于需要多个逻辑步骤的问题尤为有价值。例如,“‘盗梦空间’主演获奥斯卡奖后发行的票房最高的电影的导演是谁?”
回答这个查询需要:
-
确定“盗梦空间”的主演
-
确定他们何时获得奥斯卡奖
-
找到随后一年票房最高的电影
-
确定该电影的导演
超关联图可以表示所有这些连接,使得 RAG 系统能够高效地导航所需信息。
时间信息处理的改进
许多复杂查询涉及跨不同时期进行事件和事实推理。超关系图在代表和推理时间信息方面表现出色:
-
事实可以与特定时间点或范围关联
-
事件之间的关系可以得到明确建模(例如,“发生在之前”,“发生期间”)
-
随时间变化的事实可以被高效地表示
这种时间意识使RAG系统能够更准确和细致地处理类似“公司在并购后几年内的策略发生了什么变化?”的查询。
解决冲突信息
在现实世界的知识库中,经常会遇到来自不同来源的矛盾信息。超关系图提供了用于表示和推理这些冲突的机制:
-
可以使用源信息存储事实的多个版本
-
可将置信度分数与不同声明关联
-
时间限定词可以帮助解决明显的矛盾
当面临冲突信息时,RAG系统可以利用这些功能来:
-
识别冲突
-
评估不同来源的可靠性
-
考虑时间背景
-
在适当时呈现承认不确定性的细致答案
这种方法导致更强大和可信赖的问答能力。
提高可解释性
使用超关系图在 RAG 系统中具有的一个关键优势是提高可解释性的潜力。图的结构化特性使系统能够:
-
追踪用于得出答案的推理路径
-
识别利用的具体事实和关系
-
为每个信息提供清晰的来源
这种可解释性不仅对于建立对系统输出的信任是宝贵的,而且对于调试和改进底层模型也是重要的。研究人员和开发人员可以分析推理路径,以确定系统表现优秀或有困难的领域,从而进行有针对性的改进。
HOLMES 系统展示了这种可解释性的潜力。通过检查为不同查询生成的修剪子图,研究人员能够深入了解系统如何处理各种类型的问题。
结论
超关系图代表了 RAG 系统演进中的重大飞跃。通过实现更丰富的上下文表示、更有针对性的信息检索以及先进的多跳推理能力,这些结构解决了当前方法面临的许多关键限制。
超关系图的好处不仅仅限于改善性能指标。它们使 RAG 系统能够:
-
处理更复杂和微妙的查询
-
提供更具上下文适应性的答案
-
提供更大的透明度和可解释性
-
通过专注于相关信息更高效地运作
这些进步对自然语言处理领域以及 AI 领域具有深远的影响。更有能力的问答系统可以增强:
-
信息检索和知识管理
-
决策支持系统
-
智能辅导和教育平台
-
研究和科学发现工具
展望未来,出现了几个关键问题和研究方向:
-
可扩展性:我们如何有效地构建和更新超级关系图,以应对真正海量的知识库?
-
与神经方法的整合:如何以最有效的方式将超关系图与神经检索和推理方法结合起来?
-
跨领域推理:我们如何利用超关系图来支持涉及多个知识领域的推理?
-
交互系统:超关系图能否实现更动态、多轮问答交互?
-
伦理考虑:我们如何确保这些系统的增强功能被负责任地使用,并解决知识表示中的潜在偏见?
随着研究人员继续探索这些问题,有一点是清楚的:超关系图有望在下一代智能问答系统中发挥核心作用。通过提供更加微妙和上下文化的知识表示,它们使我们更接近那种可以像人类一样灵活深入地思考复杂主题的 AI 系统。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。