本论文从加密算法、完整性校验、访问控制技术、密文数据去重和可信删除、密文搜索等方面,对当前大数据安全保护关键技术的研究现状进行分类阐述。
一、大数据安全需求
1. 机密性
数据机密性是指数据不被授权者、实体或进程利用或泄露的特性。为了保障大数据安全,数据常常被加密。常见的加密方法有公钥加密、私钥加密、代理重加密、广播加密、属性加密、同态加密等。传统的加密方法不能直接用在大数据上的原因是数据加密和解密会带来额外的计算开销,需要以尽可能小的计算开销带来可靠的数据机密性。支持关键字搜索是大数据数据安全保护的一个重要方面。已有的支持搜索的加密只支持单关键字搜索,并且不支持搜索结果排序和模糊搜索。目前,这方面的研究集中在明文中的模糊搜索、支持排序的搜索和多关键字搜索等操作。如果是加密数据,用户需要把涉及的数据密文发送回用户方解密之后再进行,严重降低效率。
2. 完整性
数据完整性是指数据没有遭受以非授权方式的篡改或使用,以保证接收者收到的数据与发送者发送的数据完全一致,确保数据的真实性。远程数据完整性验证是解决云中数据完整性检验的方法,能够在不下载用户数据的情况下,仅仅根据数据标识和服务器对于挑战码的响应对数据的完整性进行验证。
3. 访问控制
在保障大数据安全时,必须防止非法用户对非授权的资源和数据等的访问、使用、修改和删除等各种操作,以及细粒度的控制合法用户的访问权限。
二、大数据安全保护技术研究进展和未来趋势
1. 加密算法
针对大数据的机密性,我们可以使用加密算法对数据加密。
DES、AES等对称加密手段,虽然能保证对存储数据的加解密速度,但其密钥管理较为复杂,不适合有大量用户的大数据环境中;传统的RSA等非对称加密手段,虽然对密钥易于管理,但算法计算量太大,不适用于对不断增长的大数据进行加解密。
开发快速加解密技术是大数据安全保护技术的一个重要研究方向。