RAG 工业落地方案框架(Qanything、RAGFlow、FastGPT、智谱RAG)细节比对
原创 Lily 大模型新视界 2024年06月24日 22:23 四川
原文:https://zhuanlan.zhihu.com/p/704828374
所谓 RAG,简单来说,包含三件事情。
第一,Indexing。即怎么更好地把知识存起来。
第二,Retrieval。即怎么在大量的知识中,找到一小部分有用的,给到模型参考。
第三,Generation。即怎么结合用户的提问和检索到的知识,让模型生成有用的答案。这三个步骤虽然看似简单,但在 RAG 应用从构建到落地实施的整个过程中,涉及较多复杂的工作内容(细节上是魔鬼)。
架构几乎按照这个模块设计,但是各家落地方案各有不同