论文精读记录9.17

最新推荐文章于 2024-10-04 13:19:28 发布

国服倒一夜露

最新推荐文章于 2024-10-04 13:19:28 发布

阅读量364

点赞数 4

文章标签：网络安全

本文链接：https://blog.csdn.net/m0_59010538/article/details/142318308

版权

Unleashing Worms and Extracting Data: Escalating the Outcome of Attacks against
RAG-based Inference in Scale and Severity Using Jailbreaking

本文的贡献在于：1、同时利用成员推测攻击和越狱攻击基于RAG的LLM。

2、利用蠕虫技术，将针对单个大模型的攻击扩展到针对一个大语言模型系统的攻击。

3、利用嵌入碰撞技术来提取RAG中相应的文档，从而达成成员推测攻击。

本文缺点：未提出针对此攻击的有效防御措施

探讨了在检索增强生成（RAG）模型中，通过越狱（jailbreak）技术，攻击者如何扩大对基于生成性人工智能（GenAI）应用的攻击规模和严重性。文章分为两部分，第一部分讨论了如何将RAG成员推断攻击和RAG实体提取攻击升级为RAG文档提取攻击，从而对单个GenAI应用造成更严重的影响。第二部分展示了攻击者如何通过构造一个触发计算机蠕虫链式反应的对抗性自复制提示，将RAG数据投毒攻击从单一GenAI应用扩展到整个GenAI生态系统。

在第一部分中，作者评估了三种提取方法的结果，并分析了五种嵌入算法的类型和大小、提供的上下文大小以及GenAI引擎对结果的影响。研究表明，攻击者可以从RAG支持的问答聊天机器人数据库中提取80%-99.8%的数据。在第二部分中，作者展示了攻击者如何通过越狱GenAI模型，发送一条消息，触发生态系统内的计算机蠕虫链式反应，迫使每个受影响的应用执行恶意活动并传播到新应用中。作者评估了蠕虫在GenAI邮件助手中创建用户保密数据链式提取的性能，并分析了上下文大小、对抗性自复制提示、嵌入算法的类型和大小以及传播跳数对蠕虫性能的影响。

文章还回顾并分析了保护RAG基础推理的各种防护措施，并讨论了权衡。最后，作者讨论了攻击的局限性，回顾了相关工作，并得出了结论。