RAG
文章平均质量分 97
-派神-
每天进步一点点……
展开
-
RAG进阶(一): 多重查询(Multi Query)
今天我们学习了如何如何避免在做RAG检索时,由于查询语句因人而异而导致检索结果不够全面和完整。我们的主要方法是当用户在做检索时,我们让LLM基于用户的查询语句再生成多个查询语句,这些由LLM生成的查询语句能够从多个视角用户的查询语句进行补充。这样可以使得LLM能够更加准确的理解用户查询语句的真正含义从而给出更加完整且全面的答案。原创 2024-04-19 16:14:13 · 951 阅读 · 0 评论 -
大型语言模型的语义搜索(二):文本嵌入(Text Embeddings)
单词和句子嵌入是大型语言模型(LLM)的主要工作。它们是大多数语言模型的基础构件,它通过捕获了单词、语义和语言细微差别之间的许多关系,并将其转换为有关相应数字,从而将人类语言(单词)翻译为计算机能理解的语言(数字)。原创 2024-02-24 18:58:44 · 1394 阅读 · 2 评论 -
大型语言模型的语义搜索(一):关键词搜索
关键词搜索(Keyword Search)是文本搜索种一种常用的技术,很多知名的应用app比如Spotify、YouTube 或 Google map等都会使用关键词搜索的算法来实现用户的搜索任务,关键词搜索是构建搜索系统最常用的方法,最常用的搜索算法是,简称BM25。在信息检索中,Okapi BM25(BM是最佳匹配的缩写)是搜索引擎用来估计文档与给定搜索查询的相关性的排名函数。原创 2024-02-22 18:14:26 · 1712 阅读 · 0 评论 -
高级RAG(八): 自动合并检索(Auto-merging Retrieval)
关于自动合并检索评估的方法总结和补充说明:使用不同的文档层次结构参数进行迭代(级别数、子级数)和不同的块大小使用 RAG三元组评估应用程序版本跟踪实验以选择最佳的文档分割的层次结构参数找到关于最适合某些文档类型的超参数(文档层次结构参数)的直觉自动合并检索是对句子-窗口检索的补充原创 2024-01-19 13:24:36 · 1530 阅读 · 1 评论 -
高级RAG(七): 评估句子-窗口检索
今天我们详细介绍了如何使用trulens对LlamaIndex的句子窗口检索结果进行评估,基于成本的考虑我们只进行了两轮评估,从评估的结果上看 Sentence window size =1 似乎是个较为理想的值,因为它的各项指标均由于Sentence window size =3,希望今天的内容对大家学习RAG有所帮助。原创 2024-01-16 13:23:47 · 1249 阅读 · 0 评论 -
高级RAG(六): 句子-窗口检索
Sentence Window Retrieval 是一种检索策略,用于检索与查询相关的文本。它首先检索最相关的句子,然后返回围绕该句子的更广泛的文本,以便为 LLM 提供更广泛的上下文来支撑其响应。原创 2024-01-13 11:35:06 · 1371 阅读 · 0 评论 -
高级RAG(五):TruLens 评估-扩大和加速LLM应用程序评估
今天我们学习了TruLens评估的基本原理,其中包括RAG三元组Context Relevance,Groundedness和Answer Relevance的定义和作用,然后我们又使用llamaIndex开发了基本RAG应用,最后我们使用了TruLens的反馈函数对基本RAG的检索结果进行了评估。希望今天的内容对大家学习RAG有所帮助.原创 2024-01-08 19:03:30 · 1517 阅读 · 1 评论 -
高级RAG(四):RAGAs评估
RAGAs (Retrieval-AugmentedGenerationAssessment) 它是一个框架(github官方文档question:用户输入的问题。answer:从 RAG 系统生成的答案(由LLM给出)。contexts:根据用户的问题从外部知识源检索的上下文即与问题相关的文档。: 人类提供的基于问题的真实(正确)答案。这是唯一的需要人类提供的信息。原创 2024-01-03 16:53:17 · 2938 阅读 · 5 评论 -
使用python快速开发与PDF文档对话的Gemini聊天机器人
今天我们主要介绍了如何开发一个简单的RAG系统:基于pdf文档问答的机器人应用,其中我们应用了langchain的父文档检索策略,panel的页面聊天组件chat_interface以及谷歌的Gemini大模型。希望今天的内容对大家学习RAG和聊天机器人程序有所帮助。原创 2023-12-31 13:39:58 · 1568 阅读 · 0 评论