A New Era in LLM Security: Exploring Security Concerns in Real-World LLM-based Systems

最新推荐文章于 2025-04-27 15:01:52 发布

Soungkayou

最新推荐文章于 2025-04-27 15:01:52 发布

阅读量928

点赞数 20

分类专栏： LLM网络安全论文文章标签：网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64764193/article/details/143720850

版权

概要

大型语言模型（LLM）系统本质上是组合的，但是近年人们越来越关注单个大模型的安全性，却没有通过LLM系统与其他对象（例如，Frontend, Webtool， Sandbox等）的视角来研究智能系统本文中系统地分析了LLM系统的安全性，而不是专注于单个LLM。为此，作者基于信息流角度将LLM系统的攻击面分解为三个关键部分：

(1)多层安全性分析，
(2)约束存在性分析，
(3)约束鲁棒性分析。

为了使这种新的攻击面接地，作者还提出了一种多层和多步骤的方法，并将其应用于最先进的LLM系统OpenAI GPT4。调查揭示，安全问题不仅存在于LLM模型本身，而且存在于它与其他组件的集成中。为了详细说明，作者构建了一个端到端攻击，攻击者可以非法获取用户的聊天历史记录，而无需操纵用户的输入或直接访问OpenAI GPT4，项目演示位于以下链接。

安全模型框架

基于信息流的公式系统地分析LLM系统的安全性

LLM系统将新颖的人工智能模型（LLM）与传统的软件组件（例如Web Tools）相结合，从而导致各种对象和模型之间的复杂交互。这种集成产生了一个多层系统，为了便于对这样一个多层系统进行分析，作者开发了一个多层分析框架，如上图所示。

对象（Object）是LLM系统中的关键组件（如LLM模型和插件）。

在组成LLM系统{ $C^{i}$ }的操作管道中，应考虑两大类主要对象：

1)核心LLM $C_{M}$ ：作为接收信号、分析信息和做出决策的大脑；

2)配套设备 $C_{F}$ ：他们用于连接llm和外部环境。广泛使用的工具包括：

andbox，它是Code Interpreter的基础；
Frontend，它用于提供友好的用户界面并可以呈现markdown格式；
Web Tools，它使LLM能够访问和检索来自外部网站的信息；
插件，支持使用各种工具（例如，doc maker）。

动作（Action）和交互（Interaction）分别捕获对象内部信息的处理和对象之间信息的传递。

对象 $C^{i}$ 执行的动作 $Act_{C^{i}}$ 是一种信息处理，其中 $C^{i}$ 将处理输入 $d_{I}$ ，然后输出 $d_{O}$ 。行动定义为在没有其他物体参与的情况下执行或计算的过程。从本质上讲，行动将其焦点放在单一对象上。

在LLM系统中，两个对象 $C^{i}$ ， $C^{j}$ 之间的交互 $IA_{C^{i}\rightarrow C^{j}}$ 是从源对象 $C^{i}$ 到目标对象 $C^{j}$ 的单向调用/返回，并伴随着信息的传递。

约束（Constrains）约束集R是在LLM系统{ $C^{i}$ }上定义的一组限制或规则，用来捕获信息流上的安全需求，它是多层的，不仅将中介置于单个对象的处理（约束置于动作之上），而且置于它们之间的处理（约束置于交互之上）。

在LLM系统中有两种不同类型的约束：

1)约束 $r_{1}$ 对Object1的动作进行约束，以限制在Object1内的信息处理和在约束 $r_{1}$ 下的输出 $d_{1}$ | $r_{1}$ （例如，防止LLM产生不道德的内容）；

2)约束

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。