书生实战训练营基础岛第四关RAG实验

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


任务需求

提示:这里可以添加本文要记录的大概内容:

背景问题:
正式介绍检索增强生成(Retrieval Augmented Generation,RAG)技术以前,大家不妨想想为什么会出现这样一个技术。 给模型注入新知识的方式,可以简单分为两种方式,一种是内部的,即更新模型的权重,另一个就是外部的方式,给模型注入格外的上下文或者说外部信息,不改变它的的权重。 第一种方式,改变了模型的权重即进行模型训练,这是一件代价比较大的事情,大语言模型具体的训练过程,可以参考InternLM2技术报告。第二种方式,并不改变模型的权重,只是给模型引入格外的信息。类比人类编程的过程,第一种方式相当于你记住了某个函数的用法,第二种方式相当于你阅读函数文档然后短暂的记住了某个函数的用法

这是基础岛的任务,看起来简单但是实际还是有一些难度。
提示:以下是本篇文章正文内容,下面案例可供参考

一、环境布置

首先需要创建一个专用的环境,例如该环境名为llamaindex,需要的依赖包如下:在这里插入图片描述

需要额外安装 Llamainde词向量模型,通过huggingface进行下载
在这里插入图片描述

Llamaindex是一款开源词向量模型来进行 Embedding,目前选用这个模型是相对轻量、支持中文且效果较好的,
还可以利用streamlit创建一个web界面方便我们实时操作!
最终经过一些列的指令和操作,终于打开了这个期待已久的web界面,如下:
在这里插入图片描述

二、RAG实战

1.在进行词向量之前先问InternLM2 1.8B什么是矩阵范数

在这里插入图片描述

可以看出它能够知道矩阵范数,但是回答特变笼统,接下里我们通过导入一个矩阵范数的相关文章,然后让它更清楚的知道矩阵范数的意义。导入如下:
在这里插入图片描述

2.对导入知识进行向量化之后再询问的结果

文章中对范数的几个定义:1范数、2范数、无穷范数(向量范数)

这三种不同的范数都是不同的度量方法。

(0范数,向量中非零元素的个数,这里不解释)

1范数:所有元素绝对值的和。

2范数:所有元素平方和的开方。

无穷范数:正无穷范数:所有元素中绝对值最小的。负无穷范数:所有元素中绝对值最大的。

║x║∞=max(│x1│,│x2│,…,│xn│)

下面是导入范数文档后模型生成的回答
在这里插入图片描述
在这里插入图片描述
可以看出模型对矩阵范数的定义更加清晰明了了!!!!

总结

书生实战训练眼第三期----RAG实践作业的博客
通过这次作业掌握了一个有用的大模型应用技巧!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值