数据要素流转与数据内外循环
1. 从数据生命周期看数据要素流转
数据流转链路主要包括:
- 采集
- 存储
- 加工
- 使用
- 提供
- 传输
2. 数据要素外循环是构建数据要素市场的核心
内循环:数据持有方在自己的运维管控域内对自己的数据使用和安全拥有全责。
外循环:数据要素离开持有方管控域,在使用方运维域,持有方依然拥有管控需求和责任。
数据外循环中的信任焦虑
1. 信任焦虑的原因
信任焦虑主要源于数据权属不明确和数据滥用的风险。
2. 信任焦虑的关键问题之一:数据权属
三权分置下,如何在数据流通过程中确保数据提供方的数据持有权和经营方的经营权,并防止数据被滥用,从而有效促进使用权流通?
3. 信任焦虑的解决方案:从主体信任到技术信任
信任本质上是对不确定性和复杂性的依赖。基于安全可信的技术信任体系是支撑全行业数据要素安全可控流转的基础。
数据要素流通的技术信任体系
- 控制面:以区块链/可信计算为核心支撑技术构建数据使用权跨域管控层。
- 数据面:以隐私计算为核心支撑技术构建密态数联网,包括密态枢纽与密态管道。
技术信任需要完备的信任链
- 可信云PaaS:通过技术可信代替人员可信。
- 运维权限最小化:只允许预期内的行为可以执行。
- 完备的信任链:从信任根、硬件平台、操作系统到应用系统整个链路的可信认证。
- 远程验证:能够远程验证云上运行环境,甚至执行环境安全隔离。
- 可信安全模块:使用基于硬件的可信安全模块。
数据要素流通对隐私计算的期望
隐私计算的内涵在扩大,三个原则包括:
- 原始数据不出域
- 数据可用不可见
- 数据使用可控可计量,数据可算不可识
隐私计算产品度量尺度要一致
隐私计算产品需要通用的安全分级和评测方式:
安全级别 | 性能(XGBBenchmark为例) | 可靠性 | 适用性 | 成本效能(/明文分布式计算) |
---|---|---|---|---|
① 基线防护级 | 十万样本/小时 | 99%以下 | 只支持固定算法 | 1000倍以上 |
② 审计追溯级 | 百万样本/小时 | 99% | 支持参数和结构调整的固定算法 | 100~1000倍 |
③ 广度防护级 | 千万样本/小时 | 99.9% | 支持自定义算法 | 10~100倍 |
④ 深度检验级 | 亿样本/小时 | 99.99% | 支持任意多参与方 | 2~10倍 |
⑤ 安全证明级 | 十亿样本/小时 | 99.999% | 对接任意深度学习框架和BI算法 | 1~2倍 |
隐私计算需要降低接入门槛
隐私计算需要通过开源降低门槛促进数据安全流通:
- 普惠:让更多企业轻松使用隐私计算技术。
- 安全:让技术产品的安全可信性更透明。
- 标准化:促进数据要素流转中事实标准的发展。
开源隐语助力数据要素流通
隐语四大技术优势:
- 统一架构
- 开放拓展
- 原生应用
- 性能卓越
隐语开源经过多轮安全验证,并得到多项权威认定和荣誉奖项,推动行业生态共建共享。
结语:数据要素流通与隐私计算
数据要素大潮带来了全新的数据安全外循环技术挑战:
- 信任焦虑是数据要素流通面临的关键挑战。
- 从主体信任正在逐渐走向技术信任。
宏大的前景,隐私计算面临新机会:
- 隐私计算内涵在丰富:可用不可见、可算不可识、可控可计量。
- 产品能力度量尺度要标准化。
- 开源降低接入门槛:普惠、安全、标准化。
开源隐语助力数据要素流通:
- 四大技术优势、专业的安全验证。
- 多项权威认定和荣誉奖项。
- 推动行业标准化、生态建设。