简介
使用KnockoffNet方法对预训练的Resnet50模型进行模型窃取攻击(model stealing attack)
实验设置
数据集(dataset):CIFAR、MNIST
预训练模型(pretrained model):Resnet50
受害者模型(victim model):Resnet50
窃取方法(stealing method):KnockoffNet
查询次数:10k, 20k, 30k, 40k, 50k
实验结果
补充
KnockoffNet方法
该方法来自论文《Knockoff Nets: Stealing Functionality of Black-Box Models》
论文由Tribhuvanesh Orekondy、Bernt Schiele和Mario Fritz撰写,探讨了在黑盒环境中,即只能通过输入图像并观察输出预测的情况下,攻击者能多大程度上复制一个“受害者”模型的功能
论文将模型功能窃取定义为一个两阶段的过程:
(i) 查询一组输入图像以获得黑盒模型的预测;
(ii) 使用查询到的图像-预测对训练一个“仿冒品”模型。