T-RAG = RAG + Fine-Tuning + Entity Detection

lichunericli

已于 2024-03-20 16:42:09 修改

阅读量1.1k

点赞数 29

文章标签：人工智能自然语言处理语言模型

于 2024-03-10 06:13:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lichunericli/article/details/136594890

版权

本文围绕T-RAG方法展开，该方法将RAG架构与开源微调的LLM和实体树向量数据库结合，用于对私人组织文档进行问答。研究分享了部署经验，解决了数据隐私、计算资源等问题，通过结合实体树和向量数据库增强上下文检索，为现实世界的LLMs应用提供了见解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文地址：T-RAG: Lessons from the LLM Trenches

原文地址：T-RAG = RAG + Fine-Tuning + Entity Detection

T-RAG 方法的前提是将 RAG 架构与开源微调的 LLM 和实体树向量数据库相结合。重点是上下文检索。

2024 年 2 月 15 日

介绍

大型语言模型 (LLM) 越来越多地应用于各个领域，包括对私营企业文档的问答，其中数据安全性和稳健性至关重要。

检索增强生成（RAG）是构建此类应用程序的重要框架，但确保其稳健性需要广泛的定制。

本研究分享了部署 LLM 应用程序以对私人组织文档进行问答的经验，使用名为Tree-RAG (T-RAG)的系统，该系统合并了实体层次结构以提高性能。

评估证明了这种方法的有效性，为现实世界的LLMs应用提供了宝贵的见解。

数据隐私

由于这些文档的敏感性，安全风险是首要问题，因此在公共 API 上使用专有的 LLM 模型来避免数据泄露风险是不切实际的。

这就需要使用可以在本地部署的开源模型。

此外，有限的计算资源和基于可用文档的较小的训练数据集也带来了挑战。

此外，确保对用户查询的可靠和准确的响应会增加复杂性，在此类环境中部署强大的应用程序时需要进行广泛的定制和决策。

Take-Aways

我对这项研究感兴趣的是，研究人员开发了一种应用程序，将检索增强生成（RAG）与经过微调的开源大型语言模型（LLM）集成起来以生成响应。该模型使用源自组织文档的指令数据集进行训练。

他们引入了一种新颖的评估指标，称为Correct-Verbose，旨在评估生成的响应的质量。该指标根据答案的正确性来评估答案，同时还考虑包含超出原始问题范围的其他相关信息。

T-RAG

Tree-RAG (T-RAG) 的工作流程如下：

对于给定的用户查询，在向量数据库中搜索相关文档块，该块充当LLM上下文学习的上下文参考。

如果查询提到任何组织相关实体，则从实体树中提取有关实体的信息并将其添加到上下文中。经过微调的 Llama-2 7B 模型根据所提供的数据生成响应。

T-RAG 的一个特点是除了用于上下文检索的矢量数据库之外还包含实体树。

实体树

T-RAG 的一个显着特点是它结合了实体树和向量数据库以进行上下文检索。实体树存储有关组织实体及其层次结构排列的详细信息。该树中的每个节点代表一个实体，其父节点指示它们各自的组成员身份。

在检索过程中，该框架利用实体树来增强从向量数据库检索的上下文。

实体树搜索和上下文生成的过程如下：

最初，解析器模块扫描用户查询以查找与组织内的实体名称相对应的关键字。
一旦识别出一个或多个匹配，就从树中提取有关每个匹配实体的详细信息。
这些详细信息被转换为文本陈述，提供有关实体及其在组织层次结构中的位置的信息。
随后，该信息与从向量数据库检索的文档块合并以构建上下文。
通过采用这种方法，当用户询问实体时，模型可以获得有关实体及其在组织内的层次定位的相关信息。

考虑上图，上下文生成的检索过程涉及利用组织图中的说明性示例来演示如何执行树搜索和检索。

除了获取上下文文档之外，spaCy 库还与自定义规则一起使用来识别组织内的命名实体。

如果查询包含一个或多个此类实体，则从树中提取有关该实体的分层位置的相关信息并将其转换为文本语句。然后将这些语句与检索到的文档一起合并到上下文中。

但是，如果用户的查询未提及任何实体，则省略树搜索，并且仅利用检索到的文档中的上下文。

综上所述

我发现这项研究很有趣，因为它结合了 RAG 和微调。利用本地托管的开源模型来解决数据隐私问题，同时解决推理延迟、令牌使用成本以及区域和地理可用性问题。

同样有趣的是如何通过 spaCy 框架使用实体进行实体搜索和上下文生成。事实上，这不仅仅是一项研究成果，而是基于构建供实际使用的LLMs应用程序的经验而得出的经验教训。

博客等级

码龄9年

414
原创

1万+
点赞

9846
收藏

6928
粉丝

关注

私信

热门文章

分类专栏

人工智能 9篇
传统文化-易经 17篇
传统文化 1篇
数据库 10篇
经济学 2篇
沟通 1篇
Java 2篇
缓存 4篇
架构 1篇
搜索引擎 4篇
消息队列 2篇
微服务 1篇
注意事项 1篇
LLM 应用实现总结 8篇
GIT 1篇
IM即时通讯 1篇

展开全部收起

最新评论

记一次港交所面试
liulicsu: 是纯英文面试吗
拆解 Transformer 的训练过程
tjuwzan: 最近在看Transformer的知识，的确有些地方有点没搞明白，想先请教几个问题： 1. 本篇主要讲Transformer的训练环境，图上模型最右侧，也就是Decoder的下面，是Output Embedding, 最上面是Output，他们之间有关系吗？ 2. 训练，如果是传统的机器学习或者深度学习，如果是Supervised Learning的话，应该有输入，ground truth，以及loss function，但Transformer很少有人提这个，那么Transformer的学习过程是什么？Loss Function是什么？ 3. 还是训练问题，普通深度学习模型学习的大概是W and B，Transformer的学习是Wq, Wk, Wv吗？是如何学习的呢？尤其在第7节里描述：例如，对于计算 Query 矩阵，权重矩阵的行数必须与转置矩阵的列数相同，而权重矩阵的列数可以任意；例如，我们假设权重矩阵有 4 列。权重矩阵中的值介于 0 和 1 之间，随机初始化，当 Transformer 开始学习语料的含义时，这些值会更新。文中提到的三句话，是不是语料？咱们的例子中是不是就是用这三句话作为训练例子呢？ 4. 依然是文章中描述的，把when you play the game of thrones, you win or you die. 这句话有两个部分，前面部分作为输入，后面部分作为输出，那么第一句，I drink and I know things，这里面只有一句，怎么分输入和输出呢？ 5. 掩码的作用没太理解，可否解释一下呢？很多都说是为了让模型只参考前面，而不看后面，这句话还是没有真正理解。程序员出身，一直是按照程序员思维想弄清楚每个细节，但是NLP基础有点薄弱，理解一些思想有点难度。多谢解答
Java内存模型（JMM）与Volatile关键字底层原理
Yunwushenyanying: 讲的太全面了！非常有帮助
记录些MySQL题集（4）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619168846。
DSPy入门：告别指令提示，拥抱编程之旅！
LK12mufc: 可以理解成，langchain和llamaindex需要自己写prompt。DSPY自动写prompt？？如果是这样，最终到LLM那里还是一样的呀

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。