Attacks Against Machine Learning Models

最新推荐文章于 2025-04-30 09:36:22 发布

Naomi521

最新推荐文章于 2025-04-30 09:36:22 发布

阅读量549

点赞数 10

文章标签：机器学习人工智能大数据

本文链接：https://blog.csdn.net/Naomi521/article/details/146892732

版权

1. 机器学习攻击的主要类型

这些攻击发生在模型训练阶段，通常影响数据完整性、模型学习过程，或直接引入后门（Backdoor）。

目标： 通过篡改训练数据，使模型学到错误的模式。
方法：
- 标签投毒（Label Flipping）： 修改训练数据标签（如把合法交易标为欺诈交易）。
- 特征投毒（Feature Poisoning）： 改变特征值，使模型产生偏差（如操纵信用评分模型）。
- 后门攻击（Backdoor Attack）： 在训练数据中嵌入隐蔽模式，使模型在特定触发器（Trigger）出现时输出攻击者期望的结果（如仅对某个用户或某个输入有效）。

目标： 通过修改模型参数，使其对某些输入产生错误预测。
应用案例：
- 在联邦学习（Federated Learning） 中，攻击者上传篡改的局部模型，影响全局模型的性能。
- 在金融欺诈检测系统 中，攻击者可能投毒模型，使其忽略特定模式的欺诈交易。

这些攻击发生在模型部署和推理阶段，通常用于欺骗或操控 ML 模型。

目标： 通过人为构造微小但精确的输入扰动，使模型做出错误决策。
方法：
- FGSM（Fast Gradient Sign Method）： 使用梯度方向找到最小扰动，使模型误分类。
- PGD（Projected Gradient Descent）： 迭代优化对抗样本，使攻击更有效。
- C&W 攻击（Carlini & Wagner Attack）： 通过优化攻击目标，生成更隐蔽的对抗样本。
现实应用：
- 在人脸识别系统 中，攻击者可以通过对抗样本绕过身份验证。
- 在自动交易系统 中，攻击者可以操控市场信号，误导模型的交易决策。

目标： 通过查询黑盒模型，重建其结构或参数。
方法：
- 黑盒查询（Black-box Querying）： 通过 API 获取输出数据，推测模型决策边界。
- 梯度估计（Gradient Estimation）： 通过输入变化分析模型参数。
影响：
- 竞争对手可以复制付费 AI 模型，绕过知识产权保护。
- 金融 AI 交易模型可能被黑客窃取并用于操控市场。