HippoRAG:模拟大脑记忆思索机制的 RAG

前言

人类大脑通过不断积累和更新知识来适应环境,而大型语言模型(LLMs)虽具智能,却缺乏这种动态更新能力。为解决这一问题,研究人员开发了一种名为“HippoRAG”的新框架,模仿了大脑新皮质和海马体的工作机制,显著提升了多跳问题解答的性能,比现有 RAG 方法高出 20%。HippoRAG 不仅成本低、速度快,在单一检索步骤中还优于迭代 IRCoT 方法。这展示了如何将生物学原理应用于提高 LLMs 的效率。RAG 通过将数据集分块并索引于矢量数据库中,实现高效检索。然而,传统 RAG 在涉及多块知识整合的现实任务(如法律、医学和科学领域的多跳问题解答)上表现不佳。以前的研究,如 Self-Ask[1] 和 IR-CoT[2],通过多重检索和 LLM 生成迭代连接知识块,但在处理信息分散且无直接联系的任务上仍有不足。

例如,想找到斯坦福教授托马斯进行阿尔茨海默症研究的记录,传统 RAG 可能难以完成此任务,除非有段落同时提到斯坦福和阿尔茨海默症。然而人类则能通过联想记忆迅速联想到这两点。这就是 HippoRAG 的灵感来源。

1. 海马记忆索引理论

海马记忆索引理论[3]描述了人类长期记忆的工作机制,涉及三个区域:

  • 新皮质[4]

  • 副海马区(PHR)[5]

  • 海马体[6]

它们协同完成两大功能:

  • 模式分离:将不同经历存储为不同记忆

  • 模式补全:从部分线索中检索完整记忆

感官输入经过新皮质处理为抽象特征,通过副海马区传递至海马体存储。当试图回忆时,海马体匹配部分线索并重建记忆。这种过程通过改变海马体索引,而不是直接更新新皮质表征,完成新信息的整合。

2. HippoRAG

HippoRAG 模仿了这一记忆流程,分为两个阶段:

  • 离线索引,相当于记忆编码

  • 在线检索,相当于记忆检索

2.1 离线索引

此阶段模仿大脑编码记忆的方式,使用 LLM 提取知识图谱三元组(主语、谓语、宾语),例如“爱因斯坦出生于德国”可被表述为:

  • 主语:爱因斯坦

  • 谓语:出生在

  • 宾语:德国

这些三元组构成了人工海马体索引。通过余弦相似度,进一步添加连接边,使知识图谱更具连通性,类似于副海马区的功能。

2.2 在线检索

这一阶段模仿海马体的部分线索检索。基于 LLM 提取查询实体并将其链接到知识图谱中的查询节点,节点权重根据其特异性(类似于 IDF),使用个性化页面排名(PPR)[7]算法,优先检索相关路径,最后排序语料库中的段落,指导检索系统找出最可能包含答案的段落。上图展示了 HippoRAG 与传统 RAG 的区别,后者仅孤立编码,而 HippoRAG 创建了类似大脑的关联图。

2.3 HippoRAG 的表现

HippoRAG 在三个多跳问答数据集上的表现均优于基线方法,单步检索任务的召回率提升了 20%。在多步骤检索任务中,特别是结合 IRCoT 时,也有类似表现。与 IRCoT 相比,HippoRAG 不仅性能优越,检索成本还降低了 10-30 倍,速度提升了 6-13 倍。

HippoRAG 的改进使其在问题解答上表现更佳,精确匹配(EM)和 F1 分数也更高。

3. 总结

个人觉得 HippoRAG 同样也是基于 KG 的一种 RAG,对于多跳问题天生具有优势。它使用 LLM 提取知识图谱三元组和相似度添加更多的关系连接,建立索引。它的创新在于检索机制,先获取查询语句中的实体,然后在使用 Personalized PageRank 来优先检索相关的路径,最后给出结果。简单讲,感觉就是使用 PPR 来对子图查询排序。从以上描述来看,相较于微软的 GraphRAG

  • HippoRAG 缺少社区构建报告,对于较为抽象的问题,可能是难以回答

  • 基于查询语句实体去直接匹配子图,需要对实体消歧,不然匹配效果可能比较差。而微软 GraphRAG 是采用查询语句和索引实体描述的嵌入相似度进行匹配,理论上会有更好的兼容性。

最后的最后

感谢你们的阅读和喜欢,我收藏了很多技术干货,可以共享给喜欢我文章的朋友们,如果你肯花时间沉下心去学习,它们一定能帮到你。

因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提升技术的时候,首先需要明确一个目标,然后制定好完整的计划,同时找到好的学习方法,这样才能更快的提升自己。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值