【InternLM 实战营第二期笔记3】“茴香豆“:零代码搭建你的 RAG 智能助理

ALE.code

已于 2024-04-18 21:58:49 修改

阅读量931

点赞数 16

分类专栏： nlp 文章标签：人工智能语言模型 nlp

于 2024-04-11 00:26:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45776432/article/details/137474143

版权

nlp 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

目录

补充知识点-向量知识库（Vector-DB）

RAG工作流具体示意

RAG常见优化方法

RAG v.s. 微调（Tuning）

茴香豆介绍

一些小练习

1. 在茴香豆 Web 版中创建自己领域的知识问答助手

Bonus Task 集成开发飞书

2.在 InternLM Studio 上部署茴香豆技术助手

其他优秀参考资料

笔记

视频地址：茴香豆：搭建你的 RAG 智能助理_哔哩哔哩_bilibili

文档链接：Tutorial/huixiangdou/readme.md at camp2 · InternLM/Tutorial (github.com)

作业小练习链接：Tutorial/huixiangdou/homework.md at camp2 · InternLM/Tutorial (github.com)

引言

为什么要使用RAG？以及什么是RAG？

举个🌰：

这里问题是：huixiangdou是什么？【这个属于新增知识】

- 如左图：回答其实已经开始胡编乱造，出现hallucination了

- 如右图：使用了RAG，在没有额外训练的情况下，能正确回答问题啦！

什么是RAG？

通俗一点来说，可以将RAG看成一个搜索引擎，用户输入的内容作为索引，在外部知识库中搜索该内容，结合大语言模型的能力生成回答。

三个重要的部分：Indexing，Retrieval，Generation.（索引，检索，生成）

补充知识点-向量知识库（Vector-DB）

向量表示的优化，会直接影响RAG的结果好坏

从这里开始会有很多内容来自下面这篇survey，感兴趣的小伙伴们可以看看！

Survey Link: https://arxiv.org/abs/2312.10997https://arxiv.org/abs/2312.10997

RAG工作流具体示意

LLM回答的内容，经过RAG之后，均会来自其调用的相关数据库。

RAG常见优化方法

嵌入优化，索引优化--对向量数据库的优化
查询优化和上下文管理，分别为Advanced RAG范式中的前检索，以及后检索部分。

RAG v.s. 微调（Tuning）

从对外部知识的需求，任务对模型适配度的这两个方面进行考量：

Fine-tuning: 对外部需求不高，但要求任务对模型适配度高的情况

三种方法集合在一起，当然能做一个更综合的trade-off。

RAG评测

茴香豆介绍

下图为茴香豆的工作流

一些小练习

Task1

1. 在茴香豆 Web 版中创建自己领域的知识问答助手

参考视频零编程玩转大模型，学习茴香豆部署群聊助手
完成不少于 400 字的笔记 + 线上茴香豆助手对话5轮

Step1：登录网页端（OpenXLab浦源 - 应用中心）- 创建自己的知识库（比如：这里举了个例子，如下图上传一个pdf file）

Step2：与线上茴香豆助手对话5轮

Task 1 作业截图

Bonus Task 集成开发飞书

参考链接：Docshttps://aicarrier.feishu.cn/docx/H1AddcFCioR1DaxJklWcLxTDnEc

Step1：将AppID与AppSecret填入对应的红框位置，然后“保存凭证”。

注：

这红框三个都要勾选哦！！！

Bonus Task 集成开发飞书截图

Task 2

2.在 `InternLM Studio` 上部署茴香豆技术助手

根据教程文档搭建 茴香豆技术助手，针对问题 "茴香豆怎么部署到微信群？"进行提问并截图

Task 2 针对问题 "茴香豆怎么部署到微信群？"进行提问并截图

注：

可以用sed方式更改配置文件

- sed linux命令：利用脚本的方式处理文件（Linux sed 命令 | 菜鸟教程）

创建知识库

特征提取

其他优秀参考资料

[HoK][RAG]基于茴香豆Web知识库的王者荣耀英雄故事助手[书生·浦语大模型实战营第二期第三课作业] - 知乎Keywords：InternLM， LLM，Finetune，王者荣耀, 微调, 知识库搭建，检索问答链, RAG，Retrieval Augmented Generation, Prompt Template，Web Gradio，飞书，微信，茴香豆，huixiangdou，HoK，Honor of Kings 教…https://zhuanlan.zhihu.com/p/691827925/

茴香豆也可以接入微信

参考文档：茴香豆零编程接入微信 - 知乎

关注

16
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
【InternLM 实战营第二期笔记3】“茴香豆“:零代码搭建你的 RAG 智能助理

本文主要为关于RAG的笔记以及一些practice。
复制链接

扫一扫

专栏目录

ALE.code CSDN认证博客专家 CSDN认证企业博客

码龄5年

16: 原创

36万+: 周排名

8万+: 总排名

3万+: 访问

: 等级

328: 积分

101: 粉丝

143: 获赞

8: 评论

198: 收藏

私信

关注

热门文章

分类专栏

CG 2篇
nlp 8篇
CV 2篇
GNN 1篇
Linux 1篇

最新评论

PINN(Physics-informed Neural Networks)之入门
龙骑之舞: 非常感谢您的回答。PINN网络的学习让我非常的难受，特别是我的目标函数是一个显式方程的时候。我的领域是有关跟驰轨迹预测，有两个相关研究都采用了配置数据集，也就是生成一个新数据空间的方式来生成新的物理信息。在其他相关论文的学习中，我没有见过这么做。这使得我非常困惑，质疑这种生成数据输入，通过显式方程计算输出再与net输出求loss的方式是否具意义。看完您本博客推荐的论文后我的困惑更大了，因为我在里面看到了collocation points这个词，但缺少定义且只出现了一次。这给我的感觉又变成了生成新的数据点。如果您有空闲，能否指导我一下，如何将一个显式方程整理成PDE，例如F=ma，是如何整理成一个PDE方程的。我在看完论文后，是求F关于m和a的一阶偏导和二阶偏导吗？这个二阶偏导是1吧，这怎么处理？感谢您的耐心，期待您的回复。
PINN(Physics-informed Neural Networks)之入门
ALE.code: Hello！关于您关心的问题，可以看本篇文章中具体公式理解中的Sec. Continuous time models。这里的F=ma是为了从high-level更好地理解公式的来源，具体还是需要整理成PDE。在Continuous time models的例子中，可以整理成关于时间t的一个偏微分方程。由于一般偏微分方程有可能很难直接显示求得最优解，所以可以采用data-driven的方式，即使用neural network的方式进行求解。在例子中，neural network u(t,x) 和 f(t,x)的参数，可以通过MSE loss进行optimize
PINN(Physics-informed Neural Networks)之入门
龙骑之舞: 终于看到一个不拿偏微分方程来解释的了。PINN网络在物理信息是显式的时候会出现好多难以处理的地方。首先就是数据集怎么搞，边界和关键点怎么选。要怎么做才不会显得好像是人为创造数据集。损失函数怎么搞，按作者的意思如果是F=ma，损失函数确实是模型预测和物理信息预测的偏差。但这个时候权重怎么办。如果显式方程是不知道边界和关键点怎么处理。如果博主有空能否交流一下。
fftw3.3.8的安装与编译
ALE.code: 可参考这篇文章看是否您解决您的疑惑https://blog.csdn.net/fsdgfsf/article/details/103673593
fftw3.3.8的安装与编译
ALE.code: 可参考这篇文章看是否能解决您的问题https://blog.csdn.net/fsdgfsf/article/details/103673593

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。