人脸隐私：2.AnonymousNet

最新推荐文章于 2024-09-15 15:29:29 发布

qq_38955142

最新推荐文章于 2024-09-15 15:29:29 发布

阅读量514

点赞数 1

分类专栏：人脸隐私保护文章标签：人工智能深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_38955142/article/details/116656956

版权

人脸隐私保护专栏收录该内容

6 篇文章 8 订阅

订阅专栏

AnonymousNet: Natural Face De-Identification with Measurable Privacy

现有的人脸图像去识别技术要么生成图像不够真实，要么在定性和定量上无法平衡隐私和可用性。本文提出的AnonymousNet框架用以解决上述问题，以一种自然且可测量的方式来平衡可用性和增强隐私性。框架分为四个阶段：人脸属性估计；以隐私度量为导向的人脸混淆；定向自然图像合成和对抗扰动。实现了最先进的图像质量和属性预测准确率。首次表明人脸隐私是可测量的、可以分解并因此以逼真的方式进行操控以满足不同要求和应用场景。

隐私度量

$k -$ Anonymity：要求数据集中的每一个记录至少有 $k - 1$ 条准标识符与其他记录无法区分，准标识符指的是可以一起用来识别个人的属性，如邮政编码或生日。在人脸数据集中，准标识符可能包含语义属性。若满足该条件，如果只有一个人的准标识符已知，那么真正的记录只能以 $\frac 1 k$ 的概率被选择。有一些场景中k-Anonymity无法提供有效保护，对于k个个体，如果有一些相同的准标识符，则无法对这些准标识符信息进行保护。
$l -$ Diversity：解决k-Anonymity的不足。对于表示具有相同标识符的一组记录的等价类，对于敏感信息它应当至少具有 $l$ 个“良好表示”的值。“良好表示”的直接定义是确保等价类的敏感属性有 $l$ 个不同的值，该定义中，不考虑 $l$ 个不同值的频率。对手可能会得出结论：目标身份的敏感属性具有最高频率的值。因此l-diversity有一个更强的定义，为熵l-Diversity：
$Entropy(E)\ge\log l\\ Entropy(E)=-\sum_{s\in S}p(E,s)\log p(E,s)$
其中 $E$ 是等价类， $S$ 是敏感属性的取值集合， $p (E, s)$ 是记录 $E$ 有敏感属性值 $s$ 的分数。
$t -$ Closeness：对手有时能够获得敏感属性的全局分布，为了避免该情况，提出t-closeness，根据相应敏感值分布来更新 $k -$ Anonymity，要求任何等价类中的敏感值分布 $S_E$ 必须接近其在整个数据集中的分布 $S$ ，
$\forall E:d(S,S_E)\le t$
其中 $d(S,S_E)$ 是衡量分布 $S$ 和 $S_E$ 的EM距离， $t$ 为阈值。
Randomness：向样本中添加随机噪声，给定一个个体样本，随机选取部分特征，然后添加高斯噪声 $N(0,\sigma)$ ，也可以先将敏感信息识别出来后添加高斯噪声。另一种随机化方法是向数据集中添加新的样本。从更广义的角度来看，对抗性扰动也可以看作是一种随机化方法。

AnonymousNet框架共分为四个阶段：

人脸属性预测

在这里插入图片描述

采用GoogLeNet提取人脸特征，然后训练40个随机森林分类器获得人脸属性。

隐私导向的人脸混淆

提供每张人脸图像的语义信息和整个数据库中属性分布，在隐私保证的前提下进行人脸去识别。提出了隐私保留属性选择算法(PPAS)，用来选择并更新人脸属性以至于任何属性 $E$ 的分布 $S_E$ 与真实分布 $S$ 相近。与正常的t-closeness方法不同，我们进一步在属性选择中引入随机扰动以实现 $\epsilon-$ 差分隐私。

PPAS算法

输出结果：属性集合 $\mathbb A''$
1. 属性集合 $\mathbb A\leftarrow \{E_1,\cdots,E_n\}$ ;
2. 属性集合 $\mathbb A'\leftarrow \empty$ ；
3. $N\leftarrow\|\mathbb A\|$ ；
4. for $i=1,\cdots, N$
  1. 如果 $d(S,S_{E_i})\le t$
    1. 将属性 $E_i$ 加入 $\mathbb A'$
  2. 否则
    1. 将 $\backsim E_i$ 加入 $\mathbb A'$
5. 返回 $\mathbb A''\leftarrow Perturbation(\mathbb A, \epsilon)$
自然定向的去识别

为了混淆人脸图像同时保留视觉真实性，采用生成对抗网络，对抗损失为
$L_{adv}=\mathbb E[\log(D(x))]+\mathbb E[\log(1-D(G(x)))]$
依据StarGAN定制GAN模型，同时添加属性分类损失 $L_{cls}$ 与图像重建损失 $L_{rec}$ ，三者共同组成总的目标函数：
$L=\lambda_1L_{adv}+\lambda_2L_{cls}+\lambda_3L_{rec}$
对抗扰动

假设 $\mu$ 是在 $\mathbb R^d$ 中的图像分布， $\hat k$ 是一个分类器，给定一个输入图像 $x$ ，结果为 $\hat k(x)$ ，通用扰动向量 $v\in\mathbb R^d$ 能够迷惑分类器，应当满足：
$\|v\|_p\le\xi\\ \mathbb P_{x\sim \mu}(\hat k(x+v)\ne\hat k(x)\ge1-\delta)$
其中 $\xi$ 限制通用扰动向量的大小， $\delta$ 量化所有错误样本的错误率。

使用迭代的方式来引入通用扰动向量。每一次迭代，使用DeepFool来确定出最小的扰动使得 $\hat k$ 错误分类，并将与超参数 $\epsilon_i$ 对应的通用扰动更新为总扰动 $v$ 。