【论文记录】Membership Inference Attacks Against Machine Learning Models


基础知识补充回顾

  • 精确率(precision) 、召回率(recall) : 其实只是分母不同,一个分母是预测为正的样本数,另一个是原来样本中所有的正样本数。

    1. precision 精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),因此 P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP
    2. recall 召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN),因此 R e c a l l = T P T P + F N Recall=\frac{TP}{TP+FN} Recall=TP+FNTP
  • ROC曲线,PR曲线,AUC等机器学习性能评价指标



Introduction

  • 本文的主要贡献
    quantify membership information leakage through the prediction outputs of machine learning models
  • 实现思路
    turn machine learning against itself and train an attack model
    实质即是把membership inference转变成一个2分类问题, 来区分target model对训练中遇到的输入 和 没有遇到的输入的behavior
  • 总体方法
    shadow training → → ground truth about membership → → train the attack model
  • 用来 generate training data for the shadow models 的三种方法
    • uses black-box access to the target model to synthesize data
    • uses statistics about the population
    • assumes that the adversary has access to a potentially noisy version of the target ′ ' s training dataset
  • Problem Statement · 本文基于的假设
    • The attacker has query access to the model and can obtain the model ′ '
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值