RAG技术简介

最新推荐文章于 2024-08-18 21:31:01 发布

Undefined游侠

最新推荐文章于 2024-08-18 21:31:01 发布

阅读量628

点赞数 10

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19859865/article/details/138653037

版权

相关文档：

论文链接： https://arxiv.org/abs/2005.11401

课程链接： Tutorial/huixiangdou at camp2 · InternLM/Tutorial · GitHub

视频链接：茴香豆：搭建你的 RAG 智能助理_哔哩哔哩_bilibili

RAG是一种在LLM中广泛使用的支持库外挂。如下图，基于特定知识，我们维护了一个向量数据库，用户的提问会被转换为增强的提示词，然后传入LLM中。

谈到RAG，最重要的两个词是： retrieval 和 Generation，然后是indexing和query。

关于论文的创新点，作者提到：我们实现了模型参数（parametric-memory generation model）和non-parametric memory(就是RAG)的结合。

We endow pre-trained, parametric-memory generation models with a non-parametric memory through a general-purpose fine-tuning approach which we refer to as retrieval-augmented generation (RAG).

既然反复提到“non-parametric”（22次），虽然它确实是个很老的概念了，但是考虑到它在这种文章中反复提到的频率，作者是不是应该解释一下？

parametric memory指的是把知识存储在一个分布中，最简单的，比如，我们用高斯分布来表达一个数据时，这就是一种 parametric method，而Bert，GPT这类模型，都是把知识存储在权重中。

non-parametric 指的是retrieval-based memories，这种方法的好处是支持不是存放在权重中，而是通过query的机制从知识库去获取。令人困惑的是，RAG的构造也包括了Bert等编码器结构，难道这些不算是参数化吗？

RAG论文中结构图， pre-trained retriever(Query encodder + Document index) and seq2seq model . maximum inner product search(MIPS)

从图可知， RAG包含retriever 和 generator。我们把retrieve的文档作为latent ariable。我们提出了两种方法去学习生成文字的分布。分别为RAG-Sequence（基于相同文件预测）, 和RAG-Token，基于不同文档预测。

其中，Retrever（DPR）是基于编码器的结构。比如Bert。而Generator基于Encoder-decoder的结构，比如Bart。

retriever可以用于提取文档，建立index信息，然后把index信息称为non-parametric memory信息。

而关于Generator，它是基于encoder-decoder的结构，

总结：

我不喜欢RAG的思路，号称是non-parametric的方法，实际上也引入了编码器解码器的结构去解决额外难题，另外，RAG的显存占用多大呢？

Undefined游侠

关注

10
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
RAG技术简介

parametric memory指的是把知识存储在一个分布中，最简单的，比如，我们用高斯分布来表达一个数据时，这就是一种 parametric method，而Bert，GPT这类模型，都是把知识存储在权重中。如下图，基于特定知识，我们维护了一个向量数据库，用户的提问会被转换为增强的提示词，然后传入LLM中。其中，Retrever（DPR）是基于编码器的结构。我不喜欢RAG的思路，号称是non-parametric的方法，实际上也引入了编码器解码器的结构去解决额外难题，另外，RAG的显存占用多大呢？
复制链接

扫一扫

Undefined游侠 CSDN认证博客专家 CSDN认证企业博客

码龄10年

64: 原创

2万+: 周排名

2万+: 总排名

2万+: 访问

: 等级

988: 积分

271: 粉丝

345: 获赞

5: 评论

341: 收藏

私信

关注

热门文章

分类专栏

最新评论

VIT论文阅读： A Image is Worth 16x16 Words
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
EfficientAI Lab：大模型AWQ量化
cooper6666: 咨询一下，为什么现在awq只支持Int4量化，而不支持int3或者int8量化呢？
EfficientAI Lab：大模型AWQ量化
askcs517: 如何评估模型的perplexity值呢？具体方法和代码实现可以分享下吗？
EfficientAI Lab：大模型AWQ量化
小飞侠的日常学习: autoawq在公式3中，需要对s^-1 * x，但是看代码实现，没有找到这个乘法操作，作者给出的注释是# NOTE: s^-1 * x is fused here, according to paper，请问您知道这里为啥么
YOLO系列论文阅读（v1--v3）
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。