RAG基础知识概述

原味奶茶_三分甜

已于 2024-02-26 14:52:53 修改

阅读量1.8k

点赞数 41

文章标签：人工智能

于 2024-02-26 14:52:29 首次发布

本文链接：https://blog.csdn.net/weixin_44977665/article/details/136299216

版权

RAG（Retrieval-Augmented Generation）是一种自然语言处理模型架构，旨在结合检索和生成两个关键的NLP（Natural Language Processing）任务。RAG模型可以应用于诸如问答系统、文本摘要、对话系统等多个领域。

检索增强生成（Retrieval Augmented Generation），简称 RAG，已经成为当前最火热的LLM应用方案。RAG是结合检索和生成任务的自然语言处理模型架构，RAG模型通常包括如下两个主要组成部分：

1.1.1 RAG推出背景

使用过ChatGPT、文心一言、科大讯飞等大模型的读者应该对大模型的能力有了一定的了解，但当我们将大模型应用于实际业务场景时会发现，通用的基础大模型基本无法满足我们的实际业务需求，主要原因如下：

知识的局限性：大型语言模型的知识完全源于其训练数据，而这些训练数据主要构建于公开网络数据。对于实时性、非公开或离线的数据，大模型无法获取，导致模型在某些领域缺乏专业知识。
幻觉问题：所有AI模型的底层原理基于数学概率，其输出是数值运算。在缺乏特定领域知识或面对不擅长的场景时，大模型有时会产生不准确或不切实际的结果。对于用户来说，区分这种幻觉问题可能是困难的，需要用户自身对特定领域有一定的了解。
数据安全性：企业对数据安全性极为重视，不愿意承担将私域数据上传到第三方平台进行训练的风险。这使得通用大型语言模型在数据安全和模型效果方面需要进行权衡。
计算资源需求：大型语言模型在推理时需要大量计算资源，可能对一些实时性能要求高的业务应用造成挑战。模型的规模和计算效率成为需要考虑的因素之一。

上面的这些原因强调了在实际业务应用中，通用大型语言模型可能无法直接满足特定业务需求，需要更加灵活和定制化的解决方案。检索增强生成（RAG）等结合检索和生成的模型架构被提出，以弥补上述通用大模型的一些不足，特别是在处理特定领域知识和需要引用外部信息的任务中。

总结起来，RAG的优点如下所示。

矢量搜索融合：RAG 通过将矢量搜索功能与生成模型集成，引入了一种新颖的范例。这种融合使得大型语言模型 (LLM)能够生成更丰富、更具上下文感知的输出。
减少幻觉：RAG 显着降低了法学硕士的幻觉倾向，使生成的文本更加基于数据。
个人和专业实用程序：从筛选笔记等个人应用程序到更专业的集成，RAG 展示了在提高生产力和内容质量方面的多功能性，同时基于值得信赖的数据源。