书生模型实战L1---RAG 实践

最新推荐文章于 2024-08-08 22:37:55 发布

早睡早起吧

最新推荐文章于 2024-08-08 22:37:55 发布

阅读量704

点赞数 13

文章标签： python 计算机视觉人工智能

本文链接：https://blog.csdn.net/weixin_41859890/article/details/140987631

版权

书生模型实战系列文章目录

第一章入门岛L0（Linux）
第二章入门岛L0（python）
第三章入门岛L0（Git）
第四章基础岛L1（Demo）
第四章基础岛L1（Prompt）
提示：以上内容可以看往期文章
第四章基础岛L1（RAG）

作业

在这里插入图片描述

提交作业

模型回答最新的奥运信息，未加RAG时
在这里插入图片描述
加入RAG时

一、概念理解

1、什么是RAG技术

RAG（Retrieval-Augmented Generation）技术是一种结合了信息检索和文本生成的人工智能方法，常用于自然语言处理任务。它的核心思想是，在生成文本时，不仅依赖模型内部的知识，还会检索外部数据或文档，帮助生成更加准确和有针对性的回答。

假设你问一个使用了RAG技术的智能助手：“长城有多长？”智能助手首先会自己"思考"（生成模型部分），然后它还会去检索大量的资料（检索机制部分），比如历史文献、百科全书等，找到关于长城长度的准确信息。最后，它结合自己的"思考"和检索到的信息，给出一个既准确又详细的回答：“长城的总长度约为21196.18千米。”

2、Llamaindex是什么？

LlamaIndex是一种用于构建和查询大型文本数据库（或者称为索引）的工具，特别适用于需要处理大量文档或信息的应用。它帮助用户快速从大量数据中找到最相关的信息。
1、构建索引：先把一大堆文档、网页或者其他文本数据组织起来，形成一个可搜索的数据库，这个过程就叫做构建索引。
2、查询索引：当你有问题需要找到答案时，你可以通过查询这个索引，迅速定位到最相关的内容。

3、 Sentence Transformer 模型是什么？

Sentence Transformer 模型是一种专门用于将句子转化为向量（即一组数字）的人工智能模型。这些向量可以用来比较句子之间的相似度，或者用于其他自然语言处理任务，比如文本分类、信息检索等。

具体解释
句子向量化： Sentence Transformer 模型的主要功能是把句子转化为向量。向量是数学中的一种表示法，可以用来表示复杂的概念。不同的句子会被转化为不同的向量。

相似度计算：当两个句子被转化为向量后，我们可以用数学方法计算它们之间的相似度。这种相似度可以帮助我们判断两个句子是否表达了类似的意思。

举例说明假设你有两个句子：

句子1：“我喜欢吃苹果。” 句子2：“我爱吃苹果。” 传统方法：
用关键词匹配可能会发现“喜欢”和“爱”是不同的词，因此认为这两个句子不太相似。

使用 Sentence Transformer：

句子向量化：模型会把“我喜欢吃苹果”和“我爱吃苹果”分别转化为向量。相似度计算：
然后，模型会计算这两个向量的相似度，由于这两个句子的意思非常接近，相似度得分会很高。

4、Llamaindex和Sentence Transformer 模型之间的关系是什么？

LlamaIndex 和 Sentence Transformer 模型之间的关系可以理解为工具和技术之间的合作。LlamaIndex 是一个用于构建和查询大规模文本数据库的工具，而 Sentence Transformer 是一种可以将句子转化为向量的模型。这两者可以结合使用，以提高信息检索的精度和效率。

具体解释
LlamaIndex：它主要负责组织和管理大量的文本数据，并提供一个高效的查询系统。
Sentence Transformer：它专注于将句子转化为向量，用于计算句子之间的相似度或进行其他自然语言处理任务。

举例说明
假设你有一个包含大量法律文献的数据库，现在你想查找与“合同违约”相关的条款。

传统查询：如果你直接在 LlamaIndex 中搜索“合同违约”，可能会返回一些包含这几个关键词的文档，但不一定是最相关的。

结合 Sentence Transformer 模型：

向量化查询：首先，Sentence Transformer 模型会将你的查询“合同违约”转化为一个向量。
向量化文档：然后，LlamaIndex 会将数据库中的每个文档或段落也转化为向量。
计算相似度：最后，LlamaIndex 会比较查询向量和文档向量的相似度，找到最匹配的内容，并返回给你。

参考链接

https://github.com/InternLM/Tutorial/blob/camp3/docs/L1/LlamaIndex/readme.md

早睡早起吧

关注

13
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
书生模型实战L1---RAG 实践

RAG（Retrieval-Augmented Generation）技术是一种结合了信息检索和文本生成的人工智能方法，常用于自然语言处理任务。它的核心思想是，在生成文本时，不仅依赖模型内部的知识，还会检索外部数据或文档，帮助生成更加准确和有针对性的回答。假设你问一个使用了RAG技术的智能助手：“长城有多长？”智能助手首先会自己"思考"（生成模型部分），然后它还会去检索大量的资料（检索机制部分），比如历史文献、百科全书等，找到关于长城长度的准确信息。
复制链接

扫一扫