书生·浦语大模型实战营——第三课

最新推荐文章于 2024-07-05 16:44:12 发布

DominikZhuan

最新推荐文章于 2024-07-05 16:44:12 发布

阅读量1.4k

点赞数 41

文章标签：人工智能语言模型

本文链接：https://blog.csdn.net/Dominikzhuan/article/details/138029800

版权

本文介绍了书生·浦语大模型实战营的第三课内容，包括使用茴香豆搭建个人RAG智能助手的过程，涉及创建知识问答助手、在InternLMStudio部署、以及进阶作业的两个方向：应用领域知识和优化算法。

摘要由CSDN通过智能技术生成

视频链接

茴香豆：零代码搭建你的 RAG 智能助理
视频内容

视频介绍了如何使用茴香豆搭建个人RAG智能助理。首先，介绍了RAG的基础知识和原理架构，然后详细介绍了RAG的工作流程和向量数据库的优化方法。通过实例演示了RAG技术在问答系统中的应用，井解决了大模型处理知识密集任务时的各种桃战。最后，强调了向量数据库的重要性和优化方法，以及不断更新向量数据库以适应新知识的能力。
相关文档

在茴香豆 Web 版中创建自己领域的知识问答助手

在这里插入图片描述

在 InternLM Studio 上部署茴香豆技术助手

下载conda环境；

studio-conda -o internlm-base -t InternLM2_Huixiangdou

激活下载的环境，并下载相关依赖与茴香豆项目仓库代码（参照指导手册）；
修改配置文件中向量数据库和词嵌入的模型、用于检索的重排序模型和本次选用的大模型三个模型的路径；

修改好的config.ini文件内容
创建知识库：下载InternLM的Huixiangdou文档作为知识数据检索的来源，打造一个 Huixiangdou 技术问答助手；
- 注意其中的默认嵌入模型和排序模型使用的是网易的BCE双语模型，可以在config.ini中更改其模型来源；
- 茴香豆有接受和拒答两个向量数据库，用来在检索的过程中更加精确的判断提问的相关性；
- 构建向量数据库的最后发生了一个ERROR，不知效果是否有影响：
运行茴香豆知识助手：
1. ```
# 填入问题
sed -i '74s/.*/    queries = ["huixiangdou 是什么？", "茴香豆怎么部署到微信群", "今天天气怎么样？"]/' /root/huixiangdou/huixiangdou/main.py

# 运行茴香豆
cd /root/huixiangdou/
python3 -m huixiangdou.main --standalone
```
2. 运行之后会更新 langchain-community 依赖，并开始将 queries 中的问题逐一进行请求回复，在请求回复的过程中可以看到，茴香豆的分析流程：
  1. 首先对该问题打分，并提取其主题；
  2. 针对明确的主题，去检索相似度高的材料chunk，并整理成回复；

关注