:RAG
在大模型实际落地的时候,存在一些问题,主要集中在以下方面:
-
缺少垂直领域知识: 虽然大模型压缩了大量的人类知识,但在垂直场景上明显存在短板,需要专业化的服务去解决特定问题。
-
存在幻觉、应用有一定门槛: 在大模型使用上有一些幻觉、合规问题,没有办法很好地落地,配套工作不足,缺乏现成的方案来管理非结构化文本、进行测试、运营和管理等。
-
存在重复建设: 各业务孤立摸索,资产无法沉淀,存在低水平重复建设,对公司来说 ROI 低,不够高效。
站在应用的角度,需要一种能够有效解决大模型在垂直领域知识短板、降低应用门槛、提高效率并发挥规模优势的技术方案。
当前业内 RAG 是一种相对有效的解决上面问题的方案 (平台化能力、开箱即用垂直私域数据)。
实现一个基本的不难,但要真正优化 RAG 的效果,还需要投入大量的精力。这里根据个人的理解,梳理总结一些常见的 RAG