机器学习-隐私保护总览

最新推荐文章于 2024-06-30 10:08:09 发布

Atara8088

最新推荐文章于 2024-06-30 10:08:09 发布

阅读量1.7k

点赞数

文章标签：人工智能安全密码学

本文链接：https://blog.csdn.net/weixin_47695607/article/details/127680218

版权

这段时间有项目在进行，所以对斯坦福Dan Boneh密码学的阅读进度有所放缓，之后会继续更新，这段时间对当前机器学习领域隐私保护的方向做了一点小总结。

近年来，隐私保护机器学习的研究方向大致可以分为三类：

一是以k-匿名为代表的基于等价类的方法。

二是以差分隐私为代表的基于数据失真的方法。

三是以安全多方计算、同态加密、秘密共享、函数加密为代表的密码学方法。

匿名化是最早提出的隐私保护技术，其中应用较多的-匿名方法，要求发布的数据在准标识符上存在至少条不可区分的记录，使攻击者不能判断特定信息所属的具体个体。-匿名在一定程度可以保护数据隐私，但也降低了数据的可用性。

差分隐私是基于数据失真的隐私保护技术，通过注入噪声，使得增加或删除一条数据记录的操作对输出的影响不可区分，保证数据集中个体的隐私。目前已有差分隐私机器学习算法上的工作，大多是通过在训练过程中注入噪声来实现差分隐私。常见的有三种：目标函数扰动、输出扰动、梯度扰动。一般噪声越大隐私保护度越高，数据的实用性越小。

采用密码学技术来解决机器学习中的隐私问题，是研究者们最为关注的主流技术。近年来，基于同态加密、安全多方计算、函数加密等密码学技术纷纷应用于隐私保护计算领域。

这里面我觉得函数加密这版块的内容是相对比较难的，现有的文献资料也相对比较少。

——函数加密到底是什么鬼？

——Boneh等人在2011年的理论密码学会上正式提出函数加密（Functional Encryption）概念。一个函数加密方案包含四个多项式时间的算法：系统设置算法、密钥生成算法、加密算法和解密算法。在系统设置算法中，输入系统安全参数，输出系统公钥mpk和主密钥msk；在密钥生成算法中，输入msk和函数f的描述，输出函数f相应的解密私钥skf；在加密算法中，输入明文m，输出密文c；在解密算法中，输入密文c和函数解密私钥skf，输出函数值f(m)。特别地，解密私钥skf的拥有者不能得到除函数值f(m)和明文长度之外的任何信息。

更为一般的函数加密，是能够对密文实施选择性计算的，也就是说，解密只是恢复明文的部分信息，此时f(m)¹ m。近年来，函数加密成为密码学研究领域的热点。国内外学者对函数加密展开了大量的研究，主要集中在函数表达能力、安全性、扩展功能以及应用四个方面。