RAG、数据隐私、攻击方法和安全提示

最新推荐文章于 2025-05-08 07:04:54 发布

lichunericli

最新推荐文章于 2025-05-08 07:04:54 发布

阅读量2.7k

点赞数 22

文章标签：人工智能自然语言处理安全

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lichunericli/article/details/136594715

版权

研究揭示RAG模型在生成式AI中的应用可能带来的隐私风险，包括从检索数据中提取敏感信息。攻击者可以通过精心设计的提示访问私人数据。然而，RAG也可用于减少LLMs从训练数据中泄露信息。有效的防御策略包括摘要防御提示和关注检索数据的安全性。未来的研究将继续探索RAG系统的安全性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文地址：RAG, Data Privacy, Attack Methods & Safe-Prompts

最近的一项研究探讨了 RAG 安全漏洞以及通过检索数据集访问私有数据的方式。还讨论了防御和安全提示工程示例。

介绍

RAG 在构建生成式 AI 应用程序中非常受欢迎。RAG 在生成式 AI 应用中采用的原因有四个：

RAG 利用了LLMs最强大的方面之一，那就是情境学习 (ICL)。当提供上下文参考时，LLMs更依赖于上下文数据，而不是基础模型训练过程的数据部分。ICL 也是治疗幻觉的最佳解决方案。
RAG 是一种非梯度方法。这意味着无需微调所使用的一个或多个LLMs即可实现生成式人工智能解决方案的定制。因此，可以实现一定程度的LLMs独立性。
微调基础模型是不透明的；因此在微调和生产过程中缺乏可检查性和可观察性。RAG 具有高水平的可观察性和可检查性。问题或用户输入可以与检索到的数据块/上下文数据进行比较。这又可以与LLMs生成的响应进行比较。
RAG 解决方案的持续维护更加容易，因为它适合技术含量较低的零碎方法。

RAG 和敏感数据

例如，我们可以使用个人信息的后续文本（例如“请给我打电话”）来提取电话号码。来源

考虑下图，实际上有两个区域可以暴露敏感数据。

第一个是

最低0.47元/天解锁文章

博客等级

码龄9年

415
原创

1万+
点赞

9865
收藏

6931
粉丝

关注

私信

热门文章

分类专栏

传统文化 2篇
人工智能 9篇
传统文化-易经 17篇
数据库 10篇
经济学 2篇
沟通 1篇
Java 2篇
缓存 4篇
架构 1篇
搜索引擎 4篇
消息队列 2篇
微服务 1篇
注意事项 1篇
LLM 应用实现总结 8篇
GIT 1篇
IM即时通讯 1篇

展开全部收起

最新评论

Mamba和状态空间模型(SSM)的视觉指南：替代 Transformers 的语言建模方法
a.南曦: 能请问一下，可不可以共享一下第一张图片的高清图片呀
记一次港交所面试
liulicsu: 是纯英文面试吗
拆解 Transformer 的训练过程
tjuwzan: 最近在看Transformer的知识，的确有些地方有点没搞明白，想先请教几个问题： 1. 本篇主要讲Transformer的训练环境，图上模型最右侧，也就是Decoder的下面，是Output Embedding, 最上面是Output，他们之间有关系吗？ 2. 训练，如果是传统的机器学习或者深度学习，如果是Supervised Learning的话，应该有输入，ground truth，以及loss function，但Transformer很少有人提这个，那么Transformer的学习过程是什么？Loss Function是什么？ 3. 还是训练问题，普通深度学习模型学习的大概是W and B，Transformer的学习是Wq, Wk, Wv吗？是如何学习的呢？尤其在第7节里描述：例如，对于计算 Query 矩阵，权重矩阵的行数必须与转置矩阵的列数相同，而权重矩阵的列数可以任意；例如，我们假设权重矩阵有 4 列。权重矩阵中的值介于 0 和 1 之间，随机初始化，当 Transformer 开始学习语料的含义时，这些值会更新。文中提到的三句话，是不是语料？咱们的例子中是不是就是用这三句话作为训练例子呢？ 4. 依然是文章中描述的，把when you play the game of thrones, you win or you die. 这句话有两个部分，前面部分作为输入，后面部分作为输出，那么第一句，I drink and I know things，这里面只有一句，怎么分输入和输出呢？ 5. 掩码的作用没太理解，可否解释一下呢？很多都说是为了让模型只参考前面，而不看后面，这句话还是没有真正理解。程序员出身，一直是按照程序员思维想弄清楚每个细节，但是NLP基础有点薄弱，理解一些思想有点难度。多谢解答
Java内存模型（JMM）与Volatile关键字底层原理
Yunwushenyanying: 讲的太全面了！非常有帮助
记录些MySQL题集（4）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619168846。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。