机器学习-隐私保护总览

这段时间有项目在进行,所以对斯坦福Dan Boneh密码学的阅读进度有所放缓,之后会继续更新,这段时间对当前机器学习领域隐私保护的方向做了一点小总结。


近年来,隐私保护机器学习的研究方向大致可以分为三类

一是以k-匿名为代表的基于等价类的方法

二是以差分隐私为代表的基于数据失真的方法

三是以安全多方计算、同态加密、秘密共享、函数加密为代表的密码学方法

        匿名化是早提出的隐私保护技术其中应用较多的-匿名方法,要求发布的数据在准标识符上存在至少条不区分的记录使攻击者不能判断特定信息所属的具体个体。-匿名在一定程度可以保护数据隐私但也降低了数据的可用性。

        差分隐私是基于数据失真的隐私保护技术,通过注入噪声,使得增加或删除一条数据记录的操作对输出的影响不可区分,保证数据集中个体的隐私目前已有差分隐私机器学习算法上的工作,大多是通过训练过程注入噪声来实现差分隐私。常见的有三种:目标函数扰动、输出扰动、梯度扰动。一般噪声越大隐私保护度越高数据的实用性越小

        采用密码学技术来解决机器学习中的隐私问题,是研究者们最为关注的主流技术。近年来,基于同态加密、安全多方计算、函数加密等密码学技术纷纷应用于隐私保护计算领域


这里面我觉得函数加密这版块的内容是相对比较难的,现有的文献资料也相对比较少。

——函数加密到底是什么鬼?

——Boneh等人在2011年的理论密码学会上正式提出函数加密(Functional Encryption)概念。个函数加密方案包含四个多项式时间的算法:系统设置算法、密钥生成算法、加密算法和解密算法。在系统设置算法中,输入系统安全参数,输出系统公钥mpk和主密钥msk;在密钥生成算法中,输入msk和函数f的描述,输出函数f相应的解密私钥skf;在加密算法中,输入明文m,输出密文c;在解密算法中,输入密文c和函数解密私钥skf,输出函数值f(m)。特别地,解密私钥skf的拥有者不能得到除函数值f(m)和明文长度之外的任何信息。

        更为一般的函数加密,是能够对密文实施选择性计算的,也就是说,解密只是恢复明文的部分信息,此时f(m)¹ m近年来,函数加密成为密码学研究领域的热点。国内外学者对函数加密展开了大量的研究,主要集中在函数表达能力、安全性、扩展功能以及应用四个方面。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
设计一个SNS隐私保护策略推荐向导,利用机器学习方法自动计算出SNS用户的隐私保护偏好,只需要用户进行比现行SNS隐私保护机制下少得多的输入,就可以构建描述用户特定隐私偏好的机器学习模型,然后使用这个模型来自动设置用户SNS隐私保护策略。 具体的实现方法是,以用户SNS资料数据项为行,以朋友为列构建访问控制矩阵,填入allow/deny标签。对于每一个朋友抽取出若干属性特征,例如所属的“圈子”,性别,生日,城市等信息,可实现对朋友的向量化表示。基于已有的部分朋友和用户打上的访问许可的标签生成训练样本,其他朋友以及用户新添加的朋友作为测试样本。对于每一项用户资料,例如用户生日信息,系统让用户对少量朋友按照自己的意愿打上allow/deny标签,然后系统基于这些输入形成的训练样本,利用机器学习算法构建分类器,就可以使用该分类器来自动对剩余朋友及用户新添加的朋友设置对该资料的allow/deny访问权限。 现有研究表明[CCS10’ WWW10’],真实的SNS用户会更多基于不同的“圈子”来考虑他们的隐私偏好,而“圈子”信息很容易利用现有技术从社交网络图谱中抽取出来。使用朋友所属的“圈子”信息,可以自动计算出很高准确度的用户隐私保护推荐策略,而需要的用户输入比照当前的SNS隐私保护机制少很多。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值