数据已成为重要的生产要素,数据二十条中规定了数据可信流通体系,鼓励研究人员对其进行探索
1.数据可信流通
可信的概念
可信即信任,信任概念由于其抽象性和结构复杂性,在社会学、心理学、营销学、经济学、管理学等不同 的领域定义是不同的,但是达成共识的观点是:信任是涉及交易或交换关系的基础。
信任的基石有四点:①身份可确认,②利益可依赖,③能力有预期,④行为有后果
数据流通中的不可信风险
黑客门:2023 年 2 月媒 体消息,万国数据和新加坡 的数据中心被黑客攻击, 客户登录信息泄露
内鬼门:美国科技公司 Ubiquiti在2021年1月曝出 数据泄露事件,导致市值损 失数亿美元。最后确认是该 公司员工监守自盗。
滥用门:剑桥分析公司未 按约定使用从Facebook 获得的8000万用户数据, 擅自将数据用于政治广告分 析,导致脸书公司遭受50 亿美元的罚款
出现不可信风险的原因是现在的数据已有传统的内循环转变为全新的外循环模式
2.内循环与外循环
内循环:数据持有方在自己的运维安全域内对自己的数据使用和安全拥有全责
外循环:数据要素在离开持有方安全域 后,持有方依然拥有管控需求和责任
内循环中的数据安全方法在外循环中难以适用,原因是离开持有方安全域后,信任的基石遭到破坏: ①责任主体不清,②利益诉求不一致,③能力参差不齐,④责任链路难追溯
因此数据可信流通需要全新的技术要求标准与技术方法体系
3.从运维信任走向技术信任:
基于密码学与可信计算技术的数据可信流通全流程保障
- 身份可确认:可信数字身份
- 利益能对齐:使用权跨域管控
- 能力有预期:通用安全分级测评
- 行为有后果:全链路审计
(1)可信数字身份
从主体身份扩展至应用身份。使用CA证书、远程验证等技术用于核验数字应用身份,并对执行环境作度量,建立技术信用的根基。
(2)使用权跨域管控。
对齐数据流通链条上的利益诉求 ; 规范化技术要求(incl. 隐私计算、数据沙箱等)
使用权跨域管控:是指数据持有者在数据(包括密态)离开其运维安全域后,依然能够对数据如何加工使用进 行决策,防泄露防滥用,对齐上下游利益诉求 重点:①对运维人员的限制;②对数据研发过程的管控;③对全链路可信审计的保障 技术体系:包括跨域计算、跨域存储、可信审计等,不允许本地运维单方决策。可以通过 隐私计算、可信计 算、机密计算 等不同技术路线实现,但技术要求标准是一致的
(3)通用安全分级测评
通用安全分级标准,平衡功能与成本。
不可能三角”或“权衡三角 :在对安全要求、功能复杂度和单位成本进行平衡时,很难(或不可能)同时达到所有这三个方面的最高标准。
(4)全链路审计。
覆盖原始数据到衍生数据,责任界定。
- 控制面: 以可信计算和区块链为核心支撑技术构建数据流通管控层,包括 跨域管控与全链路审计
- 数据面: 以 隐私计算 为核心支撑技术构建密态数联网,包括 密态枢纽 与 密态管道
综上所述,数据可信流通需要安全可信基础设施的融合布局。