ModelScan：一款大模型序列化安全扫描工具

星尘安全

于 2024-09-26 10:54:10 发布

阅读量778

点赞数 17

分类专栏：网络安全文章标签：安全 modelscan 网络安全

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45581780/article/details/142550515

版权

网络安全专栏收录该内容

109 篇文章

订阅专栏

ModelScan是由AI初创公司ProtectAI提供的一个开源项目，旨在扫描机器学习模型以确定它们是否包含不安全的代码。它是首个支持多种模型格式的扫描工具，目前支持H5、Pickle和SavedModel格式。这个工具用于保护使用PyTorch、TensorFlow、Keras、Sklearn、XGBoost等框架的用户，目前有140+star。

为什么要扫描模型

模型通常由自动化管道创建，其他模型可能来自数据科学家的电脑中。无论哪种情况，模型都需要在使用之前从一台机器移动到另一台机器。将模型保存到磁盘的过程称为序列化。

模型序列化攻击是指在分发之前，在序列化（保存）期间将恶意代码添加到模型的内容中，这是特洛伊木马的现代版本。

该攻击通过利用模型的保存和加载过程来发挥作用。在使用加载模型时，PyTorch 会打开文件的内容并开始运行其中的代码。加载漏洞利用已执行的模型的第二秒。

model = torch.load(PATH)

模型序列化攻击可用于执行：

凭据盗窃（用于将数据写入和读取到环境中其他系统的云凭据）
数据盗窃（发送到模型的请求）
数据中毒（模型执行任务后发送的数据）
模型中毒（改变模型本身的结果）

工具使用方式

安装

pip install modelscan

安装完成后，扫描模型

modelscan -p /path/to/model_file.h5

支持参数

扫描结果

将ModelScan集成到ML Pipeline或CI/CD Pipeline

在加载模型之前扫描所有预训练模型以进行进一步工作，以防止模型不会影响您的模型构建或数据科学环境。
训练后扫描所有模型，以检测危及新模型的供应链攻击。
在部署到端点之前扫描所有模型，以确保模型在存储后未受到损害。

下面的红色块在传统的 ML 管道中突出显示了这一点。

项目地址：https://github.com/protectai/modelscan

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

星尘安全 你的鼓励将是我创作的最大动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。