【LLM大模型】人工智能|RAG 检索增强生成

Python老猿

于 2024-08-01 10:09:35 发布

阅读量159

点赞数 2

文章标签：人工智能 langchain chatgpt LLM RAG 大模型大模型微调

本文链接：https://blog.csdn.net/DEVELOPERAA/article/details/140840263

版权

简介： 1. 理解什么是 RAG 检索增强。2. 理解 RAG 检索增强应用场景。3. 了解 RAG 检索增强有哪些相关的使用方法。4. 在后续的学习过程中，会结合 LangChain 与 assistant 完成 RAG 相关的实战练习。

现有的 ChatGPT 的大语言模型中，虽然它本身的功能已经非常强悍了，但是它依然存在一些致命的问题：

那么大模型 LLM 如何解决这些问题，使其生成的内容质量更高，就成了一个难题。

而 RAG（Retrieval-Augmented Generation），通过将检索模型和生成模型（LLM）结合在一起，即可提高了生成内容的相关性和质量。

RAG 技术的主要应用场景为：

问答系统（QA Systems）：RAG 可以用于构建强大的问答系统，能够回答用户提出的各种问题。它能够通过检索大规模文档集合来提供准确的答案，无需针对每个问题进行特定训练。
文档生成和自动摘要（Document Generation and Automatic Summarization）：RAG 可用于自动生成文章段落、文档或自动摘要，基于检索的知识来填充文本，使得生成的内容更具信息价值。
智能助手和虚拟代理（Intelligent Assistants and Virtual Agents）：RAG 可以用于构建智能助手或虚拟代理，结合聊天记录回答用户的问题、提供信息和执行任务，无需进行特定任务微调。
信息检索（Information Retrieval）：RAG 可以改进信息检索系统，使其更准确深刻。用户可以提出更具体的查询，不再局限于关键词匹配。
知识图谱填充（Knowledge Graph Population）：RAG 可以用于填充知识图谱中的实体关系，通过检索文档来识别和添加新的知识点。

在这里插入图片描述

从上图可能很多同学非常好奇，大模型是如何与“外挂”数据库进行交互的。不是说大模型不能联网吗？其实大模型和数据库的交互，也是通过提示词完成的。

在这里插入图片描述

当然在以上实现过程中，可能会有数据信息极为庞大，而且冗余，如果直接发给大模型，上下文也会极为庞大。所以通常在这种情况下，会对数据库内的数据做一个预处理。让其变的易检索。这个预处理的过程，就使用了向量数据库以及embedding。

如下这张图便是 RAG 的完整过程：

在这里插入图片描述

LangChain 包括 ChatGPT 的官方 assistant 的 Retrieval 其实都利用了 RAG 的原理。在后续的课程中会有更深入的实战应用。比如打造垂直领域内容的问答机器人。

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述