书生大模型第二期课程3

本文主要从个方面进行了茴香豆个人RAG助手原来讲解:

一、理论介绍

搭建RAG智能助理

RAG是什么、原理、RAG vs Fine-tune、架构、向量数据库、评估和测试

茴香豆是一款比较新的应用,在原始的InternLM2-Chat-7B中未出现,在对原始模型7B无法回答的问题

RAG(Retrieval Augmented Generation)是一种结合检索和生成的技术,旨在通过利用外部知识库来增强大语言模型(LLMs)的性能。它通过检索用户输入的信息来生成更加准确和更丰富的回答

关于RAG的工作原理:索引(Indexing)-检索(Retrieval)-生成(Generation)

RAG常见优化方法:嵌入优化,索引优化,查询优化,上下文管理

  • 具体实现:

环境搭建:

切换官方仓库到指定版本

配置后的更改文件

2.2创建知识库步骤

下载 Huixiangdou 语料:

增加茴香豆相关的问题到接受问题示例中:

问题示例已加入

用来测试拒答流程是否起效创建

创建 RAG 检索过程中使用的向量数据库

运行茴香豆知识助手

在进行实操过程中,如何使用Intern Studio进行RAG助手的搭建,包括环境配置、下载基础文件、创建知识库等。

完成配置开发机环境:在开发机上配置必要的环境,包括选择显存、下载模型等。下载指定版本的茴香豆官方仓库,并进行配置。

创建知识库及运行茴香豆知识助手:将问题和语料进行向量化,并创建自己的向量数据库。执行命令完成了一个 茴香豆知识助手 的服务器端部署

茴香豆进阶

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值