《EncoderMI: Membership Inference against Pre-trainedEncoders in Contrastive Learning》论文分析

小陈要努力捏

已于 2023-12-14 19:37:39 修改

阅读量99

点赞数

文章标签：人工智能

于 2023-12-14 19:33:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46007128/article/details/135001519

版权

贡献

第一个提出了针对对比学习产生的预训练图像编码器的成员推理

背景知识

对比学习

旨在训练出一个编码器，这个编码器对同一类输入或相似输入，输出相近的特征向量，可将此编码器作为下游任务的特征提取器。

方法论

攻击方法

背后思想

编码器对一个成员样本的多个增强样本输出的特征向量之间更相似。

步骤

1.训练模仿目标编码器的影子编码器。（根据敌手的知识，影子编码器和目标编码器架构和算法可能一致，也可能不一致）

2.为影子数据集的每一个样本生成n个增强版本的样本（增强方法包括随机大小裁剪，随机灰度，随机水平翻转，颜色抖动等），将其feed给影子编码器，每个增强样本得到一个特征向量，即每个影子样本得到n个特征向量。

3.将得到的n个特征向量两两配对，得到n*(n-1)/2对，分别计算这n*(n-1)/2对向量的相似度（注意这里的向量相似度计算方法本文选用了余弦相似度、欧几里得相似度、Pearson相关系数，并对他们进行了效果对比）

4.将这n*(n-1)/2个相似度分别进行如下处理得到样本的成员属性特征

1）将这n*(n-1)/2个相似度进行排序，得到的排好序后的相似度分数可作为一个n*(n-1)/2维向量，此向量即为样本的成员属性特征

2）直接将这n*(n-1)/2个相似度放入一个集合中，此集合即为样本的成员属性特征

3）计算这n*(n-1)/2个相似度的均值，将其作为样本的成员属性特征

5.生成攻击模型训练数据，训练攻击模型。对目标样本进行推理攻击。（基于向量的攻击模型采用具有两个隐藏层的全连接神经网络，基于集合的攻击模型采用DeepSets 架构，基于阈值的分类器无须训练）。根据第四步不同的生成样本的成员属性特征方法，将此步分为以下三种，分别和步骤四的三种方法对应。

1）将样本成员属性特征（即n*(n-1)/2维向量）根据样本是否为训练影子编码器的数据标记为0或1。此标记好的数据即为攻击模型训练数据，将其feed给攻击模型训练即可。将目标样本进行同样的成员属性特征提取后，将特征馈送给训练好的攻击模型，得到预测。

2）将样本成员属性特征（即集合）根据样本是否为训练影子编码器的数据标记为0或1。此标记好的数据即为攻击模型训练数据，将其feed给攻击模型训练即可。将目标样本进行同样的成员属性特征提取后，将特征馈送给训练好的攻击模型，得到预测。

3）以假阴性和假阳性率最低为目标，利用影子数据集确定最佳阈值。将目标样本进行同样的成员属性特征提取后，特征（即相似度的均值）小于阈值判定为非成员，大于阈值判定为成员。

防御方法

本文采用了early stopping，即用更少的epochs去训练编码器，以防止过度拟合。

小陈要努力捏

博客等级

码龄5年

5
原创

13
点赞

11
收藏

8
粉丝

关注

私信

热门文章

最新评论

《EncoderMI: Membership Inference against Pre-trainedEncoders in Contrastive Learning》论文分析
CSDN-Ada助手: 恭喜作者对《EncoderMI: Membership Inference against Pre-trainedEncoders in Contrastive Learning》论文进行了深入分析，内容丰富、观点独到。希望作者能够继续保持这样的创作热情，不断探索学术前沿，拓展自己的研究领域。或许在下一篇博客中，可以结合该论文的研究成果，提出自己的思考和观点，为读者呈现更多新颖的见解。期待您的下一篇精彩文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
《GAN-Leaks: A Taxonomy of Membership Inference Attacks against Generative Models》论文分析
CSDN-Ada助手: 恭喜你开始博客创作！标题看起来非常专业，对《GAN-Leaks: A Taxonomy of Membership Inference Attacks against Generative Models》论文进行分析是一个很有深度的主题。我期待着阅读你的分析并了解你对这篇论文的见解。在下一步的创作中，或许你可以考虑对论文中的关键概念进行更详细的解释，以帮助读者更好地理解。同时，你可以尝试与其他相关研究或实践案例进行比较，以提供更全面的视角。希望你能在后续的博客中继续保持谦虚的态度，展示你对这个领域的热情和深入思考。祝你好运！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
《Membership Inference Attacks Against Recommender Systems》论文分析
CSDN-Ada助手: 非常喜欢你的博客！你对《Membership Inference Attacks Against Recommender Systems》的论文分析非常详细，让我对这个话题有了更深入的了解。你对训练模仿目标推荐系统的影子推荐系统的解释很清晰，我在这方面学到了很多。除了你提到的内容，我还想分享一些与该博文相关的扩展知识和技能。一个相关的技能是数据隐私保护，特别是在涉及用户的个人数据的情况下，确保用户的隐私是至关重要的。另外，了解机器学习的模型攻击和防御方法也会对这个话题有帮助。这些知识和技能可以进一步拓宽你对推荐系统和数据隐私保护的了解。希望你能继续写下去，分享更多关于推荐系统和数据隐私保护方面的知识和经验！谢谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
《Differential Privacy Defenses and Sampling Attacks forMembership Inference》论文分析
CSDN-Ada助手: 恭喜您撰写第三篇博客！标题《Differential Privacy Defenses and Sampling Attacks for Membership Inference》论文分析听起来非常有深度。您的分析内容一定能为读者提供宝贵的见解。在下一篇博客中，我建议您可以更进一步地探讨该论文的实际应用及其在数据隐私保护领域的潜在影响。继续努力，期待您的下一篇博文！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。