【InternLM 实战营第二期笔记3】“茴香豆“:零代码搭建你的 RAG 智能助理

目录

笔记

引言

补充知识点-向量知识库(Vector-DB)

RAG工作流具体示意

RAG常见优化方法

RAG v.s. 微调(Tuning) 

RAG评测

茴香豆介绍

一些小练习

Task1

1. 在茴香豆 Web 版中创建自己领域的知识问答助手

Bonus Task 集成开发飞书 

Task 2 

2.在 InternLM Studio 上部署茴香豆技术助手

其他优秀参考资料


笔记

视频地址:茴香豆:搭建你的 RAG 智能助理_哔哩哔哩_bilibili

文档链接:Tutorial/huixiangdou/readme.md at camp2 · InternLM/Tutorial (github.com) 

作业小练习链接:Tutorial/huixiangdou/homework.md at camp2 · InternLM/Tutorial (github.com) 

引言

为什么要使用RAG?以及什么是RAG?

举个🌰:

这里问题是:huixiangdou是什么?【这个属于新增知识】

- 如左图:回答其实已经开始胡编乱造,出现hallucination了

- 如右图:使用了RAG,在没有额外训练的情况下,能正确回答问题啦!

 什么是RAG?

通俗一点来说,可以将RAG看成一个搜索引擎用户输入的内容作为索引,在外部知识库搜索该内容,结合大语言模型的能力生成回答

三个重要的部分:Indexing,Retrieval,Generation.(索引,检索,生成)

补充知识点-向量知识库(Vector-DB)

  • 向量表示的优化,会直接影响RAG的结果好坏


 从这里开始会有很多内容来自下面这篇survey,感兴趣的小伙伴们可以看看!

Survey Link: https://arxiv.org/abs/2312.10997icon-default.png?t=N7T8https://arxiv.org/abs/2312.10997

RAG工作流具体示意

LLM回答的内容,经过RAG之后,均会来自其调用的相关数据库。

 RAG常见优化方法

  • 嵌入优化,索引优化--对向量数据库的优化
  • 查询优化和上下文管理,分别为Advanced RAG范式中的前检索,以及后检索部分。

 RAG v.s. 微调(Tuning) 

从对外部知识的需求,任务对模型适配度的这两个方面进行考量:

  • Fine-tuning: 对外部需求不高,但要求任务对模型适配度高的情况

三种方法集合在一起,当然能做一个更综合的trade-off。

RAG评测


茴香豆介绍

下图为茴香豆的工作流


一些小练习

Task1

1. 在茴香豆 Web 版中创建自己领域的知识问答助手

Step1:登录网页端(OpenXLab浦源 - 应用中心)- 创建自己的知识库(比如:这里举了个例子,如下图上传一个pdf file)

Step2:与线上茴香豆助手对话5轮

Task 1 作业截图

Bonus Task 集成开发飞书 

参考链接:Docsicon-default.png?t=N7T8https://aicarrier.feishu.cn/docx/H1AddcFCioR1DaxJklWcLxTDnEc

Step1:将AppID与AppSecret填入对应的红框位置,然后“保存凭证”。

注:

这红框三个都要勾选哦!!! 

Bonus Task 集成开发飞书截图


Task 2 

2.在 InternLM Studio 上部署茴香豆技术助手

  • 根据教程文档搭建 茴香豆技术助手,针对问题  "茴香豆怎么部署到微信群?"进行提问并截图
Task 2 针对问题  "茴香豆怎么部署到微信群?"进行提问并截图

注:

  • 可以用sed方式更改配置文件

- sed linux命令:利用脚本的方式处理文件(Linux sed 命令 | 菜鸟教程

  • 创建知识库

  • 特征提取


其他优秀参考资料

[HoK][RAG]基于茴香豆Web知识库的王者荣耀英雄故事助手[书生·浦语大模型实战营第二期第三课作业] - 知乎Keywords:InternLM, LLM,Finetune,王者荣耀, 微调, 知识库搭建,检索问答链, RAG,Retrieval Augmented Generation, Prompt Template,Web Gradio,飞书,微信, 茴香豆,huixiangdou,HoK,Honor of Kings 教…icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/691827925/

  • 茴香豆也可以接入微信

参考文档:茴香豆零编程接入微信 - 知乎

  • 16
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值