是什么
- 检索增强生成:Retrieval-Augmented Generation
- 提供给大模型相关参考信息,以更好的回答用户提问
解决了什么问题
大模型掌握知识有限,导致输出结果不理想
如何实现
- 检索出与提示词相关的内容
- 和提示词组成更丰富的提示信息
- 将合并后的提示信息上送给大模型
关键工程问题
- 谁决定该不该检索
- 可以由系统指定,也可以由大模型指定
- 去哪里检索
- 数据库:Mysql、Elasticsearch、向量数据库 等
- 搜索引擎
- 大模型(没错,也可以通过大模型检索)
- 如何初始化要进行检索的相关信息且能保证检索结果更高的相关性/准确性
- 为何保证相关性
- 大模型基于相关性强的内容可以更快、更好、更经济(省token)地回答问题
- 为何保证相关性
- 用什么去检索
- 用户最近输入的提示词内容
- 上下文数据