The QoS and privacy trade-off of adversarial deep learning: An evolutionary game approach

对抗式深度学习的QoS与隐私权衡:一种进化博弈方法

摘要

使用对抗深度学习的目的:使服务提供商可以自动选择对服务质量影响最小的隐私保护特征
存在的问题:如何选择合适的阈值来调整QoS和隐私保护的权重
解决模型:将QoS和隐私保护之间的矛盾激励建模为一个进化博弈
博弈策略:是否提交高质量的数据
期望收益:提交高质量函数对QoS和隐私成本的贡献

介绍

深度学习在图像处理、自然语言处理等领域有着很多的应用,并且产生了很大的经济效益。介绍了基于深度学习的服务提供过程,在此过程中,隐私可能会被泄露
基于深度学习的隐私保护有两种:基于扰动和基于对抗的方法。基于扰动的方法:对原始数据或提取出的特征进行调整,例如加噪;优点,较好的保护隐私性;缺点,影响QoS。基于对抗的方法:从服务特征中分离隐私特征,其中有篇论文引入了λ以权衡QoS和隐私保护
由于用户的完全理性和自私会导致系统无法保证长期稳定的深度学习服务,指出了不关注改善总体QoS的原因
介绍了使用一次性博弈方法的文献,介绍了深度学习服务的模型应该是一个长期的博弈过程,引出了本文使用的方法
引入了有限理性的博弈用户,即此时用户知道的信息不完全,阈值分配由知道所有的服务提供商引导,达到长期稳定
本文的贡献
1.考虑到服务质量和隐私保护之间的矛盾,我们在现实的不完全信息假设下,将竞争性深度学习的激励机制描述为一个进化博弈。该博弈可以有效地帮助用户在当前隐私成本和长期QoS收益之间找到平衡点。
2.考虑用户的有限理性,设计了一种激励机制。选择较低质量阈值的用户可能会受到服务成本的惩罚。在深度学习服务的演化博弈中,通过不断的调整,用户可以实现演化稳定策略
3.设计了一种基于ESS的算法并进行了仿真实验。结果表明,本文提出的策略能够有效地鼓励用户选择合适的阈值,并维持服务的长期运行

相关工作

深度学习有隐私保护机制

基于扰动的解决方法,对于一些特殊任务,需要进行预分析,以确保干扰添加到与任务无关的部分中
提出使用对抗学习的原因是为了防止从窃听到的特征中,重建原始数据
但使用对抗的学习对两者的权衡一般使用经验值

对抗性学习中的博弈论技术

已有的对抗学习中存在的博弈是在学习系统和对手之间,而我们提出的博弈双方是在隐私保护和QoS之间,在用户和服务提供商之间找到平衡

QoS-隐私权衡的激励机制

在QoS和隐私保护之间的激励机制大致可以分为博弈理论和非博弈理论,
非博弈理论针对于一般目的的应用而设计,分为资源敏感、信息质量敏感和隐私敏感三种方法,这些现有方法最严重的局限是缺乏参与者效用
博弈理论参与者是完全理性的,自私的,考虑最大化自身的效用。但这些方法都是一次性博弈模型,忽略了长期收益,不符合深度学习的模型,因为用户和模型的特征随着时间在不停的改变

预备工作

隐私保护深度学习的对抗式训练框架

将对抗训练网络看做三部分:特征提取、目标分类器和隐私分类器
特征提取:在用户端,和多任务学习共享层,包括输入层、卷积层、池化层和batch归一化层和目标还有隐私分类器一起训练
目标分类器:在服务方,基于任务需求和可用的计算资源选择神经网络,使用交叉熵有损函数描述应用的QoS,通过最小化该函数优化目标分类器的参数
隐私分类器:在服务方,在对抗学习框架中模拟攻击者的行为,通过目标分类器窃听到的或者特征提取器泄露的去推测隐私分布,使用交叉熵有损函数描述意思分类器的性能
在这里插入图片描述QoS与隐私保护权衡机制
QoS和隐私权衡机制

QoS和隐私保护权衡

当隐私保护和QoS的优化是几乎相同时,对抗训练框架是不工作的
QoS和隐私保护都应达到一定的值,否则对于某个任务而言是没有意义的
高度相似性和:说明隐私任务与目标任务的特征高度相关,阈值不能同时满足QoS和隐私保护的要求。这说明准确率和隐私保护效果是相反的,所以用户仍然需要在服务和隐私之间做出选择
方法相似和:隐私的特性与目标任务相对相关,但隐私保护的界限与服务质量的界限存在交叉。用户可以通过选择阈值来调整QoS和隐私的期望比率。此时,迫切需要一种自适应的λ选择方案来调整QoS和隐私保护水平
相似度低:隐私任务的特征与目标任务的特征没有紧密的联系,因此隐私信息可以很容易地从提交的特征中移除。
场景2指出了阈值的调整有实际意义但仍有问题,第一,用户如何测量他们关于QoS和隐私保护的需求;第二,在长期服务中,用户是否根据实际需要分配服务质量和隐私保护;第三,服务提供商能否设计激励机制来鼓励用户上传更好的数据以获得更高的服务质量。

深度对抗学习的激励机制

提出了经典博弈理论的不足,提出了使用进化博弈的模型,其中包括两部分,用户和服务提供商
用户:负责提交数据和交换服务的好处
服务提供商:收集分析用户数据,向用户提供好处,保持长期效益
描述了进化博弈的过程

数据分析

提出例子:在人类生气的时候,使用自动驾驶代替人类驾驶,指出用户不改变策略的条件:服务质量大于隐私泄露成本和服务费用的成本之和。
服务器在演化前所做的准备,基于每一个服务质量和隐私保护参数,设立其对应的最低的边界阈值;对应每一个参数设置,设置其相应的花销开度;设置阈值评价参数,若设置的服务质量参数,高于此参数,则会对其进行奖励
在第一次迭代过程中,不同的服务质量和隐私保护参数的服务费用是相似的,服务器在收到第一次迭代后的数据后,收集设置高于设定服务质量阈值的数量,然后设置对服务费用进行重新设置,以对他们进行奖励,并向用户发放新一轮的参数

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值