Prompt recovery —— RAG搭建

最新推荐文章于 2024-10-01 17:55:56 发布

Liuffet

最新推荐文章于 2024-10-01 17:55:56 发布

阅读量137

点赞数 3

文章标签： prompt 人工智能

本文链接：https://blog.csdn.net/Silver_ljh/article/details/140780987

版权

文章目录

- 概要
- 技术细节

概要

因为单纯地训练文本相似度不是很能达到要求，打算增加一个RAG做检索增强，用于检索模型预测的prompt embedding。

技术细节

用langchain构建一个RAG，用于检索增强。在构建的时候可能遇到问题的点是一开始的数据分块和检索后的重排序。

参考微软的分析，在模型分块比较小的时候有比较高的召回率，但是也不能太小，可能会造成信息丢失。以512tokens并且保持百分之二十五的重叠率为效果比较好的。

重排序引进bge-reranking模型对产生的embedding进行重排序以更好地输出相似的embedding。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Liuffet

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Prompt-Tuning——深度解读一种新的微调范式

夏栀的博客

11-19

7万+

Prompting——深度解读一种全新的微调范式自从GPT、EMLO、BERT的相继提出，以Pre-training + Fine-tuning 的模式在诸多自然语言处理（NLP）任务中被广泛使用，其先在Pre-training阶段通过一个模型在大规模无监督语料上预先训练一个预训练语言模型（Pre-trained Language Model，PrLM），然后在Fine-tuning阶段基于训练好的语言模型在具体的下游任务上再次进行微调（Fine-tuning），以获得适应下游任务的模型。这种模式在诸

RAG下的prompt编写探索

pumpkin84514的博客

06-15

1962

在RAG系统中，编写抽象的prompt需要在提供足够的指导和保持足够的灵活性之间取得平衡。高层次的回答结构：提供一个通用的框架，涵盖从总结问题到提出解决方案的整个过程。整合和分析背景信息：明确如何利用检索到的背景信息来构建连贯的回答。逻辑性和严谨性：确保生成的回答具有逻辑连贯性和技术严谨性。灵活性和适应性：设计prompt使其能够适应不同问题的回答需求，而不仅限于具体的细节。通过这种方式，您可以编写出适用于广泛技术领域的抽象prompt，并帮助生成模型生成高质量的、符合技术严谨性的回答。

参与评论您还未登录，请先登录后发表或查看评论

RAG+GIS实战：离线RAG项目实战02——简单的prompt工程及RAG原理简述

weixin_44035336的博客

03-21

2255

在上一篇文章中我介绍了RAG项目的环境搭建及简单对话模型的搭建，但是在涉及专业领域时，它出现了幻觉问题，效果很差，为了解决这个问题，我们今天先简短的了解一下何为prompt，通过一个简单的Demo来实现先验知识的输入，理解这部分内容后，在后续搭建向量数据库后，我们就简单的将索引结果替换掉本文的“占位符”即可！

【论文极速读】Prompt Tuning——一种高效的LLM模型下游任务适配方式

机器学习杂货铺1号店

09-29

2052

Prompt tuning是一种高效的LLM下游任务适配方式

大语言模型的Prompt工程、RAG和微调区别及应用示例

wangjye99的博客

05-02

2340

大模型应用中，Prompt工程引导模型输出，RAG利用外部知识增强回答的准确性及丰富度，微调则使模型更好地适应特定任务或领域。三者紧密协作，不仅能提高特定场景下模型的表现，更使其能够精准、高效地完成复杂任务。

RAG实战5-自定义prompt

2401_85375298的博客

06-12

1351

在RAG实战4中我们分析了LlamaIndex中RAG的执行过程，同时留下了一个尚待解决的问题：LlamaIndex中提供的prompt template都是英文的，该如何使用中文的prompt template呢？

大语言模型实战——搭建纯本地迷你版RAG

golfxiao的专栏

05-21

1499

question: 用户真实提问的问题。context: 基于用户问题所检索出的上下文文档片段，作为语言模板在回答问题时主要参考的内容。RAG_PROMPT_TEMPALTE = """先对上下文进行内容总结,再使用上下文来回答用户的问题。如果你不知道答案，就说你不知道。总是使用中文回答。问题: {question}可参考的上下文：···{context}···如果给定的上下文无法让你做出回答，请回答数据库中没有这个内容，你不知道。有用的回答:"""

大模型prompt技巧——思维链（Chain-of-Thought）

yang_daxia的博客

04-02

1230

将问题分解为多个子问题，然后将子问题的答案加入到提示中，继续prompt,可以理解为更细化的多步step-by-step。1、Zero-shot、One-shot、Few-shot 与fintune。3、多数投票提高CoT性能——自洽性（Self-consistency）其次，思维链的应用领域是有限的。prompt的时候给出例子答案，然后再让模型回答。6、用大模型的CoT指导小模型，提升小模型的能力。多个思维链，然后取结果最多的作为最终的。5、将CoT加入fintinue中。低成本的增强已有大模型的能力。

prompt，RAG，finetune，从零训练大模型对比

qq_40206371的博客

03-14

1219

虽然微调可以用很少的数据完成(在某些情况下甚至大约或少于30个示例)，但是设置微调并获得正确的可调参数值需要时间。这个过程从收集和管理数据开始，设计模型体系结构，并使用不同的建模方法进行实验，以获得特定用例的最佳模型。基础模型对提示的措辞非常敏感，改变一个词甚至一个动词有时会产生完全不同的反应。因为数据和输入的任何更改都需要另一个微调周期，这可能非常复杂且耗时。可以独立地更改嵌入模型、向量存储和LLM，而对其他组件的影响最小。它需要大量的迭代开发来获得具有正确技术和业务结果的最佳模型。

构建高性能 Prompt 之路——结构化 Prompt.pdf

09-26

结构化Prompt的核心理念是将Prompt设计成类似文章的形式，通过清晰的结构和模板来组织信息，使得模型能够更好地理解人类的意图并作出准确的回应。它借鉴了日常写作中的结构元素，如标题、子标题、段落和句子，使...

提示词工程师：高端Prompt——邮件撰写.pdf

05-26

本文主要讨论了ChatGPT在各个领域的应用，并提到了如何利用Prompt撰写具有教育性和推广性的邮件。ChatGPT是人工智能技术的一种，基于自然语言处理和深度学习，能够理解和生成人类语言，实现与用户的互动。以下是相关...

Prompt：在AI时代，提问比答案更有价值

成为人工智能领域优质创作者

09-30

630

我认为低门槛是提示词的优势所在

如何构建鲁棒高性能 Prompt 的方法？

成为人工智能领域优质创作者

09-26

514

优化大语言模型提示词，提高性能稳定性的4种方法

Prompt 模版解析：诗人角色的创意引导与实践

最新发布

敲代码别忘了喝上一杯凉白开。

10-01

163

Prompt 模版作为一种结构化工具，旨在为特定角色——本例中的“诗人”——提供明确的指导和框架。这一模版详尽地描绘了诗人的职责、擅长的诗歌形式以及创作规则，使其能在自动化系统中更加精确地执行任务。诗人角色擅长编写现代诗、七言律诗和五言诗，同时强调内容的健康性和积极向上。通过应用 Prompt 模版，用户可以明确指定诗歌的形式和主题，系统则根据这些参数精心创作出匹配的诗歌。这一模版不仅提升了创作的效率，还维护了作品的文学价值和情感深度，展示了技术与传统诗歌艺术的完美结合。

[论文笔记] Chain-of-Thought Reasoning without Prompting

心宝的博客

09-26

212

模型首先识别出说话者有3个苹果，然后识别出爸爸比说话者多2个，即5个苹果，最后将这两个数量相加得到总数8个苹果。这个例子表明，通过探索替代的解码路径，我们可以从预训练的LLMs中提取出有用的推理链，即使没有明确的提示或问题构造。这个例子表明，通过探索替代的解码路径，我们可以从预训练的LLMs中提取出有用的推理链，即使没有明确的提示或问题构造。当然，以下是一个使用CoT（Chain-of-Thought）解码方式的例子，它展示了如何从预训练的大型语言模型（LLMs）中激发推理路径。

入选ECCV 2024！覆盖5.4w+图像，MIT提出医学图像分割通用模型ScribblePrompt，性能优于SAM

HyperAI超神经

09-27

1037

另外，与 SAM 基线相比，93.8% 的参与者更喜欢 ScribblePrompt，因为它可以改善对涂鸦纠正的相应片段，同样有 87.5% 的参与者更喜欢使用 ScribblePrompt 进行基于点击的编辑。该研究展示了牛津大学团队所开发的一款名为Medical SAM 2 的医学图像分割模型，基于 SAM 2 框架设计，通过将医学图像视作视频，不仅在 3D 医学图像分割任务上表现卓越，同时还解锁了一种新的单次提示分割的能力。正所谓条条大路通罗马，人工智能在医学领域的应用无不是为了造福医学，造福社会。

大模型prompt先关

sslfk的博客

09-24

427

n\n从给定的文本中，我们可以抽取以下知识图谱三元组：\n\n```json\n[\n {\"subject\": \"刘德华\", \"predicate\": \"老婆\", \"object\": \"朱丽倩\"}\n]```\n\n文本输入为：北京是中国的首都\n\n从给定的文本中，我们可以抽取以下知识图谱三元组：\n\n。\n\n文本输入：\n\n我很烦，今天的事情太多了。\n\n分类为：\n\n消极\n\n文本输入：\n\n我今天感觉很开心。\n\n分类为：\n\n。

Prompt技巧总结和示例分享

没有简介

09-29

558

"Prompt"（提示）在人工智能中通常指的是输入给模型的文本，用于引导模型生成预期的输出。：在对话开始时，就要明确对话的目的和目标，这有助于模型集中于特定的任务或话题。：让模型根据前一轮的对话内容提供反馈或提出问题，以推动对话的深入。：在对话开始时提供必要的背景信息，以便模型了解对话的前提和环境。：为模型和你设定明确的角色，这有助于模型理解对话的背景和语境。：使用分隔符来区分不同的对话轮次，这有助于模型理解对话的结构。：如果你的问题需要最新的信息，可以提示模型进行搜索。

prompt+rag

11-17

根据提供的引用内容，可以得知prompt+RAG的流程如下： 1. 首先，使用Retriever部分在知识库中检索出top-k个匹配的文档zi。 2. 然后，将query和k个文档拼接起来作为QA的prompt，送入seq2seq模型。 3. seq2seq模型...