论文精读记录9.10

最新推荐文章于 2024-09-16 16:16:24 发布

国服倒一夜露

最新推荐文章于 2024-09-16 16:16:24 发布

阅读量332

点赞数 11

文章标签：人工智能机器学习深度学习

本文链接：https://blog.csdn.net/m0_59010538/article/details/142299968

版权

论文总结

本文《Machine Learning Models that Remember Too Much》由Congzheng Song、Thomas Ristenpart和Vitaly Shmatikov撰写，探讨了机器学习（ML）模型在处理敏感数据时可能存在的隐私泄露问题。随着ML技术的普及，许多非专家的数据持有者希望利用ML框架和服务来训练预测模型，但他们可能并不了解这些工具的内部运作。论文的核心关注点是，即使在模型训练过程中没有直接观察，恶意的ML提供者也能通过修改训练算法，使模型在保持高预测准确性的同时，记忆训练数据集中的敏感信息。

研究者们提出了几种算法，这些算法在模型参数中编码训练数据集中的敏感信息，使得即使在白盒或黑盒访问模型的情况下，也能提取这些信息。这些算法包括在模型参数的最低有效位编码信息、通过添加恶意正则化项来迫使参数与敏感信息高度相关，以及在参数的符号中编码敏感信息。此外，他们还提出了一种黑盒攻击技术，通过数据增强的方式，在不修改训练算法的情况下，使模型在训练过程中记忆合成数据的标签，从而泄露信息。

论文通过在图像分类（CIFAR10）、面部识别（LFW和FaceScrub）、文本分析（20 Newsgroups和IMDB）等标准ML任务上的实验，验证了这些技术的有效性。实验结果表明，恶意训练的模型在保持高预测能力的同时，能够准确提取训练数据的子集。

论文分析

攻击流程分析

一个典型的机器学习训练管道。数据D分为训练集Dtrain和测试集Dtest。可以使用算法A扩充训练数据，然后使用使用正则化器Ω的训练算法T计算参数。使用测试集验证结果参数，并接受或拒绝(输出一个错误)。如果参数θ被接受，则它们可能被发布(白盒模型)或部署在攻击者具有输入/输出访问权限的预测服务中(黑盒模型)。虚线框表示可能被对手控制的管道部分。