项目实训第十一周：如何实现RAG技术，如何通过RAG技术提高大模型的生成技术

最新推荐文章于 2024-10-05 08:57:27 发布

SunnyDoy

最新推荐文章于 2024-10-05 08:57:27 发布

阅读量308

点赞数 5

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_65019236/article/details/139336515

版权

一、检索增强生成（Retrieval-Augmented Generation，RAG）

RAG是一种使用外部知识库来补充大语言模型(LLM)的上下文并生成响应的技术。主要用来解决大模型的幻觉问题，LLM的幻觉定义为“生成的内容与提供的源内容不符或没有意义”）、不够专业的问题（大模型在通用领域训练时缺少某一专业性高的垂域知识）和生成不具时效性的问题。

RAG的特点可以总结以下几条：

1、RAG 是一种相对较新的人工智能技术，可以通过允许大型语言模型 (LLM) 在无需重新训练的情况下利用额外的数据资源来提高生成式 AI 的质量。

2、RAG 模型基于组织自身的数据构建知识存储库，并且存储库可以不断更新，以帮助生成式 AI 提供及时的上下文答案。

3、使用自然语言处理的聊天机器人和其他对话系统可以从 RAG 和生成式人工智能中受益匪浅。

4、实施 RAG 需要矢量数据库等技术，这些技术可以快速编码新数据，并搜索该数据以输入给LLM模型。

二、如何实现RAG技术？

有三个过程。

构建索引，对知识库中的每一个文档片段或句子进行编码，得到对应的向量表示，并存储在索引中，以便快速检索。

然后是将问题转化为查询：给定一个输入文本（如问题），利用编码器将其转换成高维向量表示。

最后是要检索片段：也即根据问题的embedding与向量数据库的embedding进行匹配度计算，匹配度高的内容将用来辅助模型的输出。

三. RAG技术的作用与价值

RAG技术在文本生成任务中发挥了重要作用，具体体现在以下几个方面：

提升文本的生成质量

通过引入外部知识库中的信息，RAG技术能够生成更加准确、丰富和具有上下文的文本。这有助于解决传统生成模型中普遍存在的重复、冗余和缺乏创意等问题。

增加多样性

RAG技术结合了检索和生成两种能力，使得生成的文本具有更高的多样性。检索到的不同信息可以为生成模型提供不同的输入和上下文，从而产生多样化的输出。

减少事实错误（缓解模型幻觉）

在知识密集型任务中，RAG技术能够通过检索外部知识库中的事实信息，减少生成文本中的事实错误。这有助于提高文本的可信度和准确性。

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。