3-茴香豆搭建个人智能助手

最新推荐文章于 2025-04-23 16:14:44 发布

wengad

最新推荐文章于 2025-04-23 16:14:44 发布

阅读量838

点赞数 5

分类专栏：大模型书生·浦语工具链文章标签：人工智能语言模型

本文链接：https://blog.csdn.net/wengad/article/details/139430097

版权

大模型同时被 3 个专栏收录

19 篇文章

订阅专栏

书生·浦语

15 篇文章

订阅专栏

工具链

10 篇文章

订阅专栏

3-茴香豆搭建个人智能助手

概述
为什么要RAG
RAG技术
- RAG和微调比较
茴香豆
搭建茴香豆
茴香豆WEB demo

概述

这是书生·浦语2.0大模型之茴香豆搭建个人智能助手的实践，内容包括了：

RAG(what、how)
茴香豆（介绍、特点、架构、构建步骤）
茴香豆实践演示

内容梗概

为什么要RAG

在知识更新比较快，语料难以搜集等情况下，使用RAG框架相对微调而言，能够快速的将新的知识融入到AI智能应用体系中。
通常在新增知识的情况下，大模型也无法回答，就会出现所谓的AI幻觉的问题。
通过RAG技术，能够建外部的知识作为prompt，输入到大模型中，再有大模型生成结果，反馈到用户，提供更为准确的回答、降低使用成本、实现可追溯的推理过程。

RAG技术

RAG(Retrieval Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的技术,旨在通过利用外部知识库来增强大型语言模型(LLMs)的性能。它通过检索与用户输入相关的信息片段，并结合这些信息来生成更准确、更丰富的回答。

RAG技术应用
RAG的工作原理可以分成两段：

将外部知识存储的过程
使用这些外部知识的过程

在外部知识入库的时候，会将知识进行①切片②向量化③存入向量数据库
在使用外部知识的过程，按照①问题向量化②搜索向量数据库，得出top-N③将问题和搜索到的知识作为prompt输入到LLM中④LLM生成回答
这里面是会用到向量数据库，embedding模型，检索算法、prompt等技术、工具、模型。
RAG工作原理
使用RAG和不使用RAG的比较
具体的RAG的发展和优化，将作为另外的文章来发布，或者也可以参考其他成熟的文献资料。