- RAG应用场景:在大模型创建后发生了一些新闻,如果不进行RAG优化,那么大模型很可能会对这些数据库中没有的问题产生幻觉(胡说八道)。
- RAG工作原理:(1) 索引:将知识源数据库中的信息转化为向量。(2) 检索:把用户输入的问题转化为向量并从库中寻找与该向量相关的向量。(3) 生成:生成最终回答
- 向量数据库:向量数据库是RAG的关键部分之一,将信息转化为固定长度的向量。而进行检索匹配的时候通常会使用余弦相似度比较的方法来找出相关向量。
- RAG优化方法:(1) 嵌入优化和索引优化:就是通过提高向量数据库的质量进行RAG优化。(2) 查询优化:使用户问题更加清晰,更适合检索。(3) 上下文管理:删去问题中的冗余信息以提高效率。(4) 迭代检索、递归检索和自适应检索:分别进行重复搜索,链式检索和主动检索。(5) LLM微调。
- RAG与微调的区别:(1) RAG通常适用于与时效性有关的任务,比较依赖外部数据库和大模型基础。(2) 微调通常适用于专业化任务,可以针对专业化任务进行特殊优化,但是对新任务的适应能力差。
书生浦语第三课
于 2024-06-25 20:43:23 首次发布