导论
数据可信流通:在“数据二十条”中首次提出,要求“建立数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范的数据可信流通体系”。
首先明确一下定义,关于信任一个共识的观点:信任是涉及交易或交换关系的基础。
信任的基石有以下:
- 身份可确认;
- 利益可依赖;
- 能力有预期;
- 行为有后果;
问题提出
可信的对立面就是不可信,在数据流通中,不可信的风险是巨大的。可以举出很多例子:黑客攻击、公司内鬼、数据滥用。
目前,数据的流通已经从原来的内循环(数据持有方在自己的运维安全域内对自己的数据使用和安全拥有权责)扩展到外循环(数据要素在离开持有方安全域后,持有方依然拥有管控需求和责任)。
而当数据扩展到外循环之后,信任基石将遭到破坏:1. 责任主体不清;2. 利益诉求不一致; 3. 能力参差不齐; 4. 责任链路难追溯。
解决方案
实现数据可信流通,从运维信任走向技术信任,解决信任级联失效,这需要全新的技术要求标准与技术方法体系。
这就需要借助基于密码学与可信计算技术的数据可信流通全流程保障。要求达到:
- 身份可确认:可信数字身份;
- 利益能对齐:使用权跨域管控;
- 能力有预期:通用安全分级测评;
- 行为有后果:全链路审计;
这也确保了之前提到的信任的基石。
接下来简要介绍实现。
身份可确认:可信数字应用身份
通过技术来证明你是你。
涉及到的体系有:
- CA证书:验证机构实体。
- 基于公私钥体系;
- 权威机构注册;
- 远程验证:验证数字应用实体。
- 基于硬件芯片可信根与可信计算体系;
- 验证网络上某节点运行的是指定的软件和硬件;
要求我们能够远程验证数字应用的身份,并对执行环境做度量,是技术信任的根基。
利益能对齐:使用权跨域掌控
使用权跨域掌控是指,数据持有者在数据(包括密态)离开其运维安全域后,依然能够对数据如何加工使用进行决策,防止泄漏和滥用,对齐上下游利益诉求。
其涉及重点:
- 对运维人员的限制;
- 对数据研发过程的管控;
- 对全链路可信审计的保障;
能力有预期:通用安全分级测评
能力预期涉及到不可能三角:安全要求、功能复杂度、单位成本。
在《数据安全法》中也将数据分为:一般数据、重要数据、核心数据。对于重要数据和核心数据,应当经受住专业的攻防检验。
行为有后果:全链路审计
在控制面上,以可信计算和区块链为核心支撑技术构建数据流通管控层,包括跨域管控与全链路审计。
在数据面上,以隐私计算为核心制程技术构建密态数联网,包括密态枢纽与密态管道。
形成全链路审计闭环,需要覆盖从原始数据到衍生数据的端到端的全过程。
密态流通能够帮助数据流转的追溯和定责。
密码学是数据密态的本源技术,能够扩展运维人员的运维域,能将数据加密保护的静态安全扩展到动态安全,能降低计算成本。
总结
通过数据要素可信流通,重构技术信任体系。