本文主要从两个方面进行了茴香豆个人RAG助手原来讲解:
一、理论介绍
搭建RAG智能助理
RAG是什么、原理、RAG vs Fine-tune、架构、向量数据库、评估和测试
茴香豆是一款比较新的应用,在原始的InternLM2-Chat-7B中未出现,在对原始模型7B无法回答的问题
RAG(Retrieval Augmented Generation)是一种结合检索和生成的技术,旨在通过利用外部知识库来增强大语言模型(LLMs)的性能。它通过检索用户输入的信息来生成更加准确和更丰富的回答
关于RAG的工作原理:索引(Indexing)-检索(Retrieval)-生成(Generation)
RAG常见优化方法:嵌入优化,索引优化,查询优化,上下文管理
- 具体实现:
环境搭建:
切换官方仓库到指定版本
配置后的更改文件
2.2创建知识库步骤
下载 Huixiangdou 语料:
增加茴香豆相关的问题到接受问题示例中:
问题示例已加入
用来测试拒答流程是否起效创建
创建 RAG 检索过程中使用的向量数据库
运行茴香豆知识助手
在进行实操过程中,如何使用Intern Studio进行RAG助手的搭建,包括环境配置、下载基础文件、创建知识库等。
完成配置开发机环境:在开发机上配置必要的环境,包括选择显存、下载模型等。下载指定版本的茴香豆官方仓库,并进行配置。
创建知识库及运行茴香豆知识助手:将问题和语料进行向量化,并创建自己的向量数据库。执行命令就完成了一个 茴香豆知识助手 的服务器端部署