RAG检索增强生成是近期几个大模型应用方向上 最难下笔的一个:
- 一方面是因为技术方案仍在快速迭代;
- 另一方面是市场对它的认知还存在一定偏差。
目前市场认为:chatBI(让大模型做数据查询和分析)很有用但是有难度;Agent(让大模型自助规划任务实现用户复杂的需求)虽然很酷炫,但是落地的应用少,不够成熟。
而对于 RAG,企业都很明确它的价值,并且技术实现上,一顿组合拳疯狂输出(文本切割 + 向量数据库 + 大模型)就能解决问题,是企业落地的不二之选。
事实真的是这样吗?这篇主要来记录一下我们在 RAG 方向有限的场景中遇到的问题及思考过程,抛砖引玉。
1.RAG检索增强 快速解读
全称 Retrieval-Augmented Generation,检索增强生成。
举个例子,比如我作为员工,直接问大模型:
提问:『 我们公司几点下班?』
大模型在没有见过我们公司《[员工手册])》的情况下(事实上,企业私有数据