我国已经开始实施国家大数据战略,主要包括大力推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全等。在这个大战略的指引下,我国的大数据应用发展取得了一定成绩,但是由此带来的大数据隐私保护问题也不少,并且已经成为一个能否健康稳定发展的一个重要关键指标,大数据应用和隐私保护必须二者得兼才能健康发展。笔者此文意在大数据采集、使用和存储等方面提出一些个人见解,仅供参考。
先说说数据的生命周期吧,所有数据都会经过这五个时期,从数据产生开始到数据有身份,再到数据存储,再就是数据使用,最后可能是数据归档不再使用或者是数据销毁不复存在。而要保障数据的全生命周期安全,当然离不开PKI技术。PKI技术(Public Key Infrastructure,公钥基础设施)是保障大数据安全的唯一可靠技术,彻底解决了(1)数据的机密性(Privacy); (2)数据生产和使用方的身份真实性(Authentication); (3)数据的完整性(Integrity); (4)数据生成行为和使用行为的不可否认性(Non-repudiation)等四大令人头痛的数据安全问题(PAIN)。
PKI技术的重要应用就是各种数字证书的数字签名和加密应用,如下图所示,看看PKI技术是如何保护大数据安全的。
- 数据产生:
数据生产者可以是人或者物体(数据采集终端),由生产者生产数据。
2.数据身份:
数据生产后应该用数据生产者的身份证书给数据数字签名来证明数据生产者的真实身份,当然是数字签名加时间戳,来证明数据产生行