大模型算法岗面试题系列（六十六）| 开源的RAG框架有哪些，你比较了解?

原创已于 2024-09-12 20:35:21 修改 · 914 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #大模型 #AI大模型 #ai #算法 #大模型面试 #面试

于 2024-08-27 11:00:00 首次发布

面试题：开源的 RAG 框架有哪些，你比较了解?

参考答案

1）Hugging Face’s Transformers

特点:

模型多样性：Transformers 库支持多种预训练的 RAG 模型，这些模型结合了不同的检索器和生成器，例如 facebook/rag-token-nq 使用了 BART 作为生成器，而 facebook/rag-sequence-nq 使用了 T5。
易用性：提供了简洁的 API 来加载模型、处理输入和生成输出。例如，使用以下代码可以快速实现 RAG 模型的问答功能：

from transformers import RagTokenizer, RagRetriever, RagGenerator, pipeline

# 初始化分词器、检索器和生成器
tokenizer = RagTokenizer.from_pretrained('facebook/rag-token-nq')
retriever = RagRetriever.from_pretrained('facebook/rag-token-nq', index_name="exact", use_dummy_dataset=True)
generator = RagGenerator.from_pretrained('facebook/rag-token-nq')

# 创建问答管道
question_answerer = pipeline("question-answering", model=generator, tokenizer=tokenizer, retriever=retriever)

# 使用模型进行问答
question = "What is the capital of France?"
answer = question_answerer(question)
print(answer)

社区支持：由于 Hugging Face 社区的活跃，该库不断更新，文档齐全，问题解决速度快。

应用:

适用于需要检索外部知识库的问答系统。
可以用于生成式对话系统，通过检索相关信息来丰富对话内容。

2）Facebook Research’s DPR and RAG

特点:

DPR：Dense Passage Retrieval 是一个高效的检索模型，它通过编码问题和文档来计算它们之间的相似度，从而找到最相关的文档段落。
RAG：Facebook 的 RAG 模型结合了 DPR 的检索能力和预训练的生成模型（如 BART 或 T5）。它首先使用 DPR 检索相关文档，然后将这些文档作为上下文输入到生成模型中。

应用: