1. 什么是RAG(retrieval-augmented-generation)技术?
RAG(Retrieval-Augmented Generation)技术是一种结合信息检索和生成模型的混合方法,旨在提高文本生成任务的质量和准确性。具体来说,RAG将检索(Retrieval)和生成(Generation)两个步骤融合在一起:
检索阶段(Retrieval Stage):在生成文本之前,系统首先从一个大型文档库中检索出与输入查询最相关的文档或段落。这一步通常使用信息检索技术,例如基于TF-IDF或BM25的传统方法,或者使用更现代的基于深度学习的检索模型。
生成阶段(Generation Stage):生成模型会将输入查询和检索到的文档或段落作为上下文,生成最终的回答或文本。这通常使用预训练的大型语言模型(如GPT-3或BERT)的生成能力。
2. RAG是谁提出来的?