书生模型实战L1---RAG 实践

书生模型实战系列文章目录

第一章 入门岛L0(Linux)
第二章 入门岛L0(python)
第三章 入门岛L0(Git)
第四章 基础岛L1(Demo)
第四章 基础岛L1(Prompt)
提示:以上内容可以看往期文章
第四章 基础岛L1(RAG)



作业

在这里插入图片描述

提交作业

模型回答最新的奥运信息,未加RAG时
在这里插入图片描述
加入RAG时
在这里插入图片描述

一、概念理解

1、什么是RAG技术

RAG(Retrieval-Augmented Generation)技术是一种结合了信息检索和文本生成的人工智能方法,常用于自然语言处理任务。它的核心思想是,在生成文本时,不仅依赖模型内部的知识,还会检索外部数据或文档,帮助生成更加准确和有针对性的回答。

假设你问一个使用了RAG技术的智能助手:“长城有多长?”智能助手首先会自己"思考"(生成模型部分),然后它还会去检索大量的资料(检索机制部分),比如历史文献、百科全书等,找到关于长城长度的准确信息。最后,它结合自己的"思考"和检索到的信息,给出一个既准确又详细的回答:“长城的总长度约为21196.18千米。”

2、Llamaindex是什么?

LlamaIndex是一种用于构建和查询大型文本数据库(或者称为索引)的工具,特别适用于需要处理大量文档或信息的应用。它帮助用户快速从大量数据中找到最相关的信息。
1、构建索引: 先把一大堆文档、网页或者其他文本数据组织起来,形成一个可搜索的数据库,这个过程就叫做构建索引。
2、查询索引: 当你有问题需要找到答案时,你可以通过查询这个索引,迅速定位到最相关的内容。

3、 Sentence Transformer 模型是什么?

Sentence Transformer 模型是一种专门用于将句子转化为向量(即一组数字)的人工智能模型。这些向量可以用来比较句子之间的相似度,或者用于其他自然语言处理任务,比如文本分类、信息检索等。

具体解释
句子向量化: Sentence Transformer 模型的主要功能是把句子转化为向量。向量是数学中的一种表示法,可以用来表示复杂的概念。不同的句子会被转化为不同的向量。

相似度计算: 当两个句子被转化为向量后,我们可以用数学方法计算它们之间的相似度。这种相似度可以帮助我们判断两个句子是否表达了类似的意思。

举例说明 假设你有两个句子:

句子1:“我喜欢吃苹果。” 句子2:“我爱吃苹果。” 传统方法:
用关键词匹配可能会发现“喜欢”和“爱”是不同的词,因此认为这两个句子不太相似。

使用 Sentence Transformer:

句子向量化: 模型会把“我喜欢吃苹果”和“我爱吃苹果”分别转化为向量。 相似度计算:
然后,模型会计算这两个向量的相似度,由于这两个句子的意思非常接近,相似度得分会很高。

4、Llamaindex和Sentence Transformer 模型之间的关系是什么?

LlamaIndex 和 Sentence Transformer 模型之间的关系可以理解为工具和技术之间的合作。LlamaIndex 是一个用于构建和查询大规模文本数据库的工具,而 Sentence Transformer 是一种可以将句子转化为向量的模型。这两者可以结合使用,以提高信息检索的精度和效率。

具体解释
LlamaIndex:它主要负责组织和管理大量的文本数据,并提供一个高效的查询系统。
Sentence Transformer:它专注于将句子转化为向量,用于计算句子之间的相似度或进行其他自然语言处理任务。

举例说明
假设你有一个包含大量法律文献的数据库,现在你想查找与“合同违约”相关的条款。

传统查询: 如果你直接在 LlamaIndex 中搜索“合同违约”,可能会返回一些包含这几个关键词的文档,但不一定是最相关的。

结合 Sentence Transformer 模型:

向量化查询: 首先,Sentence Transformer 模型会将你的查询“合同违约”转化为一个向量。
向量化文档: 然后,LlamaIndex 会将数据库中的每个文档或段落也转化为向量。
计算相似度: 最后,LlamaIndex 会比较查询向量和文档向量的相似度,找到最匹配的内容,并返回给你。

参考链接

https://github.com/InternLM/Tutorial/blob/camp3/docs/L1/LlamaIndex/readme.md

  • 13
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值